Upload Phi3ForCausalLM

Files changed (3) hide show

config.json CHANGED Viewed

@@ -5,9 +5,9 @@
   "attention_bias": false,
   "attention_dropout": 0.0,
   "auto_map": {
-    "AutoConfig": "microsoft/Phi-4-mini-instruct--configuration_phi3.Phi3Config",
-    "AutoModelForCausalLM": "microsoft/Phi-4-mini-instruct--modeling_phi3.Phi3ForCausalLM",
-    "AutoTokenizer": "microsoft/Phi-4-mini-instruct--Xenova/gpt-4o"
   },
   "bos_token_id": 199999,
   "embd_pdrop": 0.0,
@@ -29,12 +29,14 @@
   "pad_token_id": 199999,
   "partial_rotary_factor": 0.75,
   "quantization_config": {
     "modules_to_not_convert": null,
     "quant_method": "torchao",
     "quant_type": {
       "default": {
         "_data": {
           "group_size": 128,
           "layout": {
             "_data": {
               "inner_k_tiles": 8
@@ -42,18 +44,21 @@
             "_type": "TensorCoreTiledLayout",
             "_version": 1
           },
           "set_inductor_config": true,
-          "use_hqq": true,
           "zero_point_domain": {
             "_data": "NONE",
             "_type": "ZeroPointDomain"
           }
         },
         "_type": "Int4WeightOnlyConfig",
-        "_version": 1
       }
     },
-    "quant_type_kwargs": {}
   },
   "resid_pdrop": 0.0,
   "rms_norm_eps": 1e-05,
@@ -164,7 +169,7 @@
   "sliding_window": 262144,
   "tie_word_embeddings": true,
   "torch_dtype": "bfloat16",
-  "transformers_version": "4.52.0.dev0",
   "use_cache": true,
   "vocab_size": 200064
 }

   "attention_bias": false,
   "attention_dropout": 0.0,
   "auto_map": {
+    "AutoConfig": "configuration_phi3.Phi3Config",
+    "AutoModelForCausalLM": "modeling_phi3.Phi3ForCausalLM",
+    "AutoTokenizer": "Xenova/gpt-4o"
   },
   "bos_token_id": 199999,
   "embd_pdrop": 0.0,
   "pad_token_id": 199999,
   "partial_rotary_factor": 0.75,
   "quantization_config": {
+    "include_input_output_embeddings": false,
     "modules_to_not_convert": null,
     "quant_method": "torchao",
     "quant_type": {
       "default": {
         "_data": {
           "group_size": 128,
+          "int4_choose_qparams_algorithm": "hqq",
           "layout": {
             "_data": {
               "inner_k_tiles": 8
             "_type": "TensorCoreTiledLayout",
             "_version": 1
           },
+          "packing_format": "tile_packed_to_4d",
+          "preserve_zero": null,
           "set_inductor_config": true,
+          "use_hqq": false,
           "zero_point_domain": {
             "_data": "NONE",
             "_type": "ZeroPointDomain"
           }
         },
         "_type": "Int4WeightOnlyConfig",
+        "_version": 2
       }
     },
+    "quant_type_kwargs": {},
+    "untie_embedding_weights": false
   },
   "resid_pdrop": 0.0,
   "rms_norm_eps": 1e-05,
   "sliding_window": 262144,
   "tie_word_embeddings": true,
   "torch_dtype": "bfloat16",
+  "transformers_version": "4.55.4",
   "use_cache": true,
   "vocab_size": 200064
 }

generation_config.json CHANGED Viewed

@@ -6,5 +6,5 @@
     199999
   ],
   "pad_token_id": 199999,
-  "transformers_version": "4.52.0.dev0"
 }

     199999
   ],
   "pad_token_id": 199999,
+  "transformers_version": "4.55.4"
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8d8e3b9096abe58a1092e2f5f53e88916716a23d0e4942bb5aff7fa883d88f33
-size 2941004562

 version https://git-lfs.github.com/spec/v1
+oid sha256:99cad594e45263155d3a7b076d7672304348d1c0132eed39a02fdc5d09efc7dd
+size 2940988651