mobiuslabsgmbh
/

gemma-3-12b-it_4bitgs64_bfp16_hqq_hf

8-bit precision

Model card Files Files and versions Community

mobicham commited on Apr 5

Commit

9593552

·

verified ·

1 Parent(s): f2f84f2

Update README.md

Files changed (1) hide show

README.md +12 -0

README.md CHANGED Viewed

@@ -5,6 +5,18 @@ base_model:
 ---
 This is an HQQ-quantized version (4-bit, group-size=64) of the <a href="https://huggingface.co/google/gemma-3-12b-it">gemma-3-12b-it</a> model.
 ## Usage
 ```Python
 #use transformers up to 52cc204dd7fbd671452448028aae6262cea74dc2

 ---
 This is an HQQ-quantized version (4-bit, group-size=64) of the <a href="https://huggingface.co/google/gemma-3-12b-it">gemma-3-12b-it</a> model.
+## Performance
+| Models            | <a href="https://huggingface.co/google/gemma-3-12b-it">bfp16</a> | <a href="https://huggingface.co/mobiuslabsgmbh/gemma-3-12b-it_4bitgs64_bfp16_hqq_hf">HQQ 4-bit gs-64</a> | <a href="https://huggingface.co/gaunernst/gemma-3-12b-it-int4-awq">QAT 4-bit gs-32</a> |
+|:-------------------:|:--------:|:--------:|:--------:|
+| ARC (25-shot)      | 0.724 | 0.701 | 0.690 |
+| HellaSwag (10-shot)| 0.839 | 0.826 | 0.792 |
+| MMLU (5-shot)      | 0.730 | 0.724 | 0.693 |
+| TruthfulQA-MC2     | 0.580 | 0.585 | 0.550 |
+| Winogrande (5-shot)| 0.766 | 0.774 | 0.755 |
+| GSM8K (5-shot)     | 0.874 | 0.862 | 0.808 |
+| Average            | 0.752 | 0.745 | 0.715 |
 ## Usage
 ```Python
 #use transformers up to 52cc204dd7fbd671452448028aae6262cea74dc2