nidum
/

Nidum-Llama-3.2-3B-Uncensored

@@ -69,7 +69,27 @@ print(assistant_response)
 ```
 ---
 ### Datasets and Fine-Tuning
 The following fine-tuning datasets are leveraged to enhance specific model capabilities:

 ```
 ---
+#### Quantized Models Available for Download
+| **Quantized Model Version**                                                                                       | **Description**                                                                 |
+|-------------------------------------------------------------------------------------------------------------------|---------------------------------------------------------------------------------|
+| [**Nidum-Llama-3.2-3B-Uncensored-F16.gguf**](https://huggingface.co/nidum/Nidum-Llama-3.2-3B-Uncensored-GGUF/blob/main/Nidum-Llama-3.2-3B-Uncensored-F16.gguf) | Full 16-bit floating point precision for maximum accuracy on high-end GPUs.     |
+| [**model-Q2_K.gguf**](https://huggingface.co/nidum/Nidum-Llama-3.2-3B-Uncensored-GGUF/blob/main/model-Q2_K.gguf)               | Optimized for minimal memory usage with lower precision, suitable for edge cases.|
+| [**model-Q3_K_L.gguf**](https://huggingface.co/nidum/Nidum-Llama-3.2-3B-Uncensored-GGUF/blob/main/model-Q3_K_L.gguf)           | Balanced precision with enhanced memory efficiency for medium-range devices.    |
+| [**model-Q3_K_M.gguf**](https://huggingface.co/nidum/Nidum-Llama-3.2-3B-Uncensored-GGUF/blob/main/model-Q3_K_M.gguf)           | Mid-range quantization for moderate precision and memory usage balance.         |
+| [**model-Q3_K_S.gguf**](https://huggingface.co/nidum/Nidum-Llama-3.2-3B-Uncensored-GGUF/blob/main/model-Q3_K_S.gguf)           | Smaller quantization steps, offering moderate precision with reduced memory use.|
+| [**model-Q4_0_4_4.gguf**](https://huggingface.co/nidum/Nidum-Llama-3.2-3B-Uncensored-GGUF/blob/main/model-Q4_0_4_4.gguf)       | Performance-optimized for low memory, ideal for lightweight deployment.         |
+| [**model-Q4_0_4_8.gguf**](https://huggingface.co/nidum/Nidum-Llama-3.2-3B-Uncensored-GGUF/blob/main/model-Q4_0_4_8.gguf)       | Extended quantization balancing memory use and inference speed.                 |
+| [**model-Q4_0_8_8.gguf**](https://huggingface.co/nidum/Nidum-Llama-3.2-3B-Uncensored-GGUF/blob/main/model-Q4_0_8_8.gguf)       | Advanced memory precision targeting larger contexts.                            |
+| [**model-Q4_K_M.gguf**](https://huggingface.co/nidum/Nidum-Llama-3.2-3B-Uncensored-GGUF/blob/main/model-Q4_K_M.gguf)           | High-efficiency quantization for moderate GPU resources.                        |
+| [**model-Q4_K_S.gguf**](https://huggingface.co/nidum/Nidum-Llama-3.2-3B-Uncensored-GGUF/blob/main/model-Q4_K_S.gguf)           | Optimized for smaller-scale operations with compact memory footprint.           |
+| [**model-Q5_K_M.gguf**](https://huggingface.co/nidum/Nidum-Llama-3.2-3B-Uncensored-GGUF/blob/main/model-Q5_K_M.gguf)           | Balances performance and precision, ideal for robust inferencing environments.  |
+| [**model-Q5_K_S.gguf**](https://huggingface.co/nidum/Nidum-Llama-3.2-3B-Uncensored-GGUF/blob/main/model-Q5_K_S.gguf)           | Moderate quantization targeting performance with minimal resource usage.        |
+| [**model-Q6_K.gguf**](https://huggingface.co/nidum/Nidum-Llama-3.2-3B-Uncensored-GGUF/blob/main/model-Q6_K.gguf)               | High-precision quantization for accurate and stable inferencing tasks.          |
+| [**model-TQ1_0.gguf**](https://huggingface.co/nidum/Nidum-Llama-3.2-3B-Uncensored-GGUF/blob/main/model-TQ1_0.gguf)             | Experimental quantization for targeted applications in test environments.       |
+| [**model-TQ2_0.gguf**](https://huggingface.co/nidum/Nidum-Llama-3.2-3B-Uncensored-GGUF/blob/main/model-TQ2_0.gguf)             | High-performance tuning for experimental use cases and flexible precision.      |
+---
 ### Datasets and Fine-Tuning
 The following fine-tuning datasets are leveraged to enhance specific model capabilities: