mlx-community-staging
/

gemma-3-1b-it-mlx-4Bit-dynamic

@@ -88,10 +88,7 @@
             "bits": 6,
             "group_size": 64
         },
-        "model.layers.2.self_attn.o_proj": {
-            "bits": 6,
-            "group_size": 64
-        },
         "model.layers.2.self_attn.q_norm": false,
         "model.layers.2.self_attn.k_norm": false,
         "model.layers.2.self_attn.rope": false,
@@ -515,7 +512,10 @@
             "bits": 6,
             "group_size": 64
         },
-        "model.layers.18.self_attn.v_proj": true,
         "model.layers.18.self_attn.o_proj": true,
         "model.layers.18.self_attn.q_norm": false,
         "model.layers.18.self_attn.k_norm": false,
@@ -525,10 +525,7 @@
             "bits": 6,
             "group_size": 64
         },
-        "model.layers.18.mlp.up_proj": {
-            "bits": 6,
-            "group_size": 64
-        },
         "model.layers.18.input_layernorm": false,
         "model.layers.18.post_attention_layernorm": false,
         "model.layers.18.pre_feedforward_layernorm": false,
@@ -555,7 +552,10 @@
         "model.layers.19.post_feedforward_layernorm": false,
         "model.layers.20.self_attn.q_proj": true,
         "model.layers.20.self_attn.k_proj": true,
-        "model.layers.20.self_attn.v_proj": true,
         "model.layers.20.self_attn.o_proj": {
             "bits": 6,
             "group_size": 64
@@ -750,10 +750,7 @@
             "bits": 6,
             "group_size": 64
         },
-        "model.layers.2.self_attn.o_proj": {
-            "bits": 6,
-            "group_size": 64
-        },
         "model.layers.2.self_attn.q_norm": false,
         "model.layers.2.self_attn.k_norm": false,
         "model.layers.2.self_attn.rope": false,
@@ -1177,7 +1174,10 @@
             "bits": 6,
             "group_size": 64
         },
-        "model.layers.18.self_attn.v_proj": true,
         "model.layers.18.self_attn.o_proj": true,
         "model.layers.18.self_attn.q_norm": false,
         "model.layers.18.self_attn.k_norm": false,
@@ -1187,10 +1187,7 @@
             "bits": 6,
             "group_size": 64
         },
-        "model.layers.18.mlp.up_proj": {
-            "bits": 6,
-            "group_size": 64
-        },
         "model.layers.18.input_layernorm": false,
         "model.layers.18.post_attention_layernorm": false,
         "model.layers.18.pre_feedforward_layernorm": false,
@@ -1217,7 +1214,10 @@
         "model.layers.19.post_feedforward_layernorm": false,
         "model.layers.20.self_attn.q_proj": true,
         "model.layers.20.self_attn.k_proj": true,
-        "model.layers.20.self_attn.v_proj": true,
         "model.layers.20.self_attn.o_proj": {
             "bits": 6,
             "group_size": 64

             "bits": 6,
             "group_size": 64
         },
+        "model.layers.2.self_attn.o_proj": true,
         "model.layers.2.self_attn.q_norm": false,
         "model.layers.2.self_attn.k_norm": false,
         "model.layers.2.self_attn.rope": false,
             "bits": 6,
             "group_size": 64
         },
+        "model.layers.18.self_attn.v_proj": {
+            "bits": 6,
+            "group_size": 64
+        },
         "model.layers.18.self_attn.o_proj": true,
         "model.layers.18.self_attn.q_norm": false,
         "model.layers.18.self_attn.k_norm": false,
             "bits": 6,
             "group_size": 64
         },
+        "model.layers.18.mlp.up_proj": true,
         "model.layers.18.input_layernorm": false,
         "model.layers.18.post_attention_layernorm": false,
         "model.layers.18.pre_feedforward_layernorm": false,
         "model.layers.19.post_feedforward_layernorm": false,
         "model.layers.20.self_attn.q_proj": true,
         "model.layers.20.self_attn.k_proj": true,
+        "model.layers.20.self_attn.v_proj": {
+            "bits": 6,
+            "group_size": 64
+        },
         "model.layers.20.self_attn.o_proj": {
             "bits": 6,
             "group_size": 64
             "bits": 6,
             "group_size": 64
         },
+        "model.layers.2.self_attn.o_proj": true,
         "model.layers.2.self_attn.q_norm": false,
         "model.layers.2.self_attn.k_norm": false,
         "model.layers.2.self_attn.rope": false,
             "bits": 6,
             "group_size": 64
         },
+        "model.layers.18.self_attn.v_proj": {
+            "bits": 6,
+            "group_size": 64
+        },
         "model.layers.18.self_attn.o_proj": true,
         "model.layers.18.self_attn.q_norm": false,
         "model.layers.18.self_attn.k_norm": false,
             "bits": 6,
             "group_size": 64
         },
+        "model.layers.18.mlp.up_proj": true,
         "model.layers.18.input_layernorm": false,
         "model.layers.18.post_attention_layernorm": false,
         "model.layers.18.pre_feedforward_layernorm": false,
         "model.layers.19.post_feedforward_layernorm": false,
         "model.layers.20.self_attn.q_proj": true,
         "model.layers.20.self_attn.k_proj": true,
+        "model.layers.20.self_attn.v_proj": {
+            "bits": 6,
+            "group_size": 64
+        },
         "model.layers.20.self_attn.o_proj": {
             "bits": 6,
             "group_size": 64