Upload folder using huggingface_hub

Browse files

Files changed (7) hide show

README.md +5 -8
config.json +4 -2
mergekit_config.yml +3 -6
model.safetensors +2 -2
special_tokens_map.json +1 -1
tokenizer.json +2 -2
tokenizer_config.json +7 -4

README.md CHANGED Viewed

@@ -1,8 +1,8 @@
 ---
 base_model:
-- google/gemma-3-1b-pt
 - NuclearAi/Nuke_X_Gemma3_1B_Reasoner_v1.0
 - google/gemma-3-1b-it
 library_name: transformers
 tags:
 - mergekit
@@ -21,9 +21,9 @@ This model was merged using the Passthrough merge method.
 ### Models Merged
 The following models were included in the merge:
-* [google/gemma-3-1b-pt](https://huggingface.co/google/gemma-3-1b-pt)
 * [NuclearAi/Nuke_X_Gemma3_1B_Reasoner_v1.0](https://huggingface.co/NuclearAi/Nuke_X_Gemma3_1B_Reasoner_v1.0)
 * [google/gemma-3-1b-it](https://huggingface.co/google/gemma-3-1b-it)
 ### Configuration
@@ -35,19 +35,16 @@ dtype: bfloat16
 merge_method: passthrough
 slices:
 - sources:
-  - layer_range: [0, 2]
     model: google/gemma-3-1b-pt
 - sources:
   - layer_range: [0, 26]
     model: google/gemma-3-1b-it
 - sources:
-  - layer_range: [10, 16]
     model: NuclearAi/Nuke_X_Gemma3_1B_Reasoner_v1.0
 - sources:
-  - layer_range: [18, 22]
-    model: google/gemma-3-1b-it
-- sources:
-  - layer_range: [25, 26]
     model: google/gemma-3-1b-pt
 ```

 ---
 base_model:
 - NuclearAi/Nuke_X_Gemma3_1B_Reasoner_v1.0
 - google/gemma-3-1b-it
+- google/gemma-3-1b-pt
 library_name: transformers
 tags:
 - mergekit
 ### Models Merged
 The following models were included in the merge:
 * [NuclearAi/Nuke_X_Gemma3_1B_Reasoner_v1.0](https://huggingface.co/NuclearAi/Nuke_X_Gemma3_1B_Reasoner_v1.0)
 * [google/gemma-3-1b-it](https://huggingface.co/google/gemma-3-1b-it)
+* [google/gemma-3-1b-pt](https://huggingface.co/google/gemma-3-1b-pt)
 ### Configuration
 merge_method: passthrough
 slices:
 - sources:
+  - layer_range: [2, 8]
     model: google/gemma-3-1b-pt
 - sources:
   - layer_range: [0, 26]
     model: google/gemma-3-1b-it
 - sources:
+  - layer_range: [10, 18]
     model: NuclearAi/Nuke_X_Gemma3_1B_Reasoner_v1.0
 - sources:
+  - layer_range: [24, 26]
     model: google/gemma-3-1b-pt
 ```

config.json CHANGED Viewed

@@ -7,7 +7,7 @@
   "attn_logit_softcapping": null,
   "bos_token_id": 2,
   "cache_implementation": "hybrid",
-  "eos_token_id": 1,
   "final_logit_softcapping": null,
   "head_dim": 256,
   "hidden_activation": "gelu_pytorch_tanh",
@@ -17,7 +17,7 @@
   "max_position_embeddings": 32768,
   "model_type": "gemma3_text",
   "num_attention_heads": 4,
-  "num_hidden_layers": 39,
   "num_key_value_heads": 1,
   "pad_token_id": 0,
   "query_pre_attn_scalar": 256,
@@ -29,6 +29,8 @@
   "sliding_window_pattern": 6,
   "torch_dtype": "bfloat16",
   "transformers_version": "4.51.1",
   "use_cache": true,
   "vocab_size": 262144
 }

   "attn_logit_softcapping": null,
   "bos_token_id": 2,
   "cache_implementation": "hybrid",
+  "eos_token_id": 106,
   "final_logit_softcapping": null,
   "head_dim": 256,
   "hidden_activation": "gelu_pytorch_tanh",
   "max_position_embeddings": 32768,
   "model_type": "gemma3_text",
   "num_attention_heads": 4,
+  "num_hidden_layers": 42,
   "num_key_value_heads": 1,
   "pad_token_id": 0,
   "query_pre_attn_scalar": 256,
   "sliding_window_pattern": 6,
   "torch_dtype": "bfloat16",
   "transformers_version": "4.51.1",
+  "unsloth_fixed": true,
+  "unsloth_version": "2025.3.19",
   "use_cache": true,
   "vocab_size": 262144
 }

mergekit_config.yml CHANGED Viewed

@@ -3,17 +3,14 @@ dtype: bfloat16
 merge_method: passthrough
 slices:
 - sources:
-  - layer_range: [0, 2]
     model: google/gemma-3-1b-pt
 - sources:
   - layer_range: [0, 26]
     model: google/gemma-3-1b-it
 - sources:
-  - layer_range: [10, 16]
     model: NuclearAi/Nuke_X_Gemma3_1B_Reasoner_v1.0
 - sources:
-  - layer_range: [18, 22]
-    model: google/gemma-3-1b-it
-- sources:
-  - layer_range: [25, 26]
     model: google/gemma-3-1b-pt

 merge_method: passthrough
 slices:
 - sources:
+  - layer_range: [2, 8]
     model: google/gemma-3-1b-pt
 - sources:
   - layer_range: [0, 26]
     model: google/gemma-3-1b-it
 - sources:
+  - layer_range: [10, 18]
     model: NuclearAi/Nuke_X_Gemma3_1B_Reasoner_v1.0
 - sources:
+  - layer_range: [24, 26]
     model: google/gemma-3-1b-pt

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c978ba9d6e1b77cc96ef5733ea0b2d3ba3988179c928480f6764899b9c93093f
-size 2697725816

 version https://git-lfs.github.com/spec/v1
+oid sha256:b39fe6af7173bccd6769050d489e5b66d7e4b6cc50bf090ea70f9e82997e0ad3
+size 2858783032

special_tokens_map.json CHANGED Viewed

@@ -9,7 +9,7 @@
   },
   "eoi_token": "<end_of_image>",
   "eos_token": {
-    "content": "<eos>",
     "lstrip": false,
     "normalized": false,
     "rstrip": false,

   },
   "eoi_token": "<end_of_image>",
   "eos_token": {
+    "content": "<end_of_turn>",
     "lstrip": false,
     "normalized": false,
     "rstrip": false,

tokenizer.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7d4046bf0505a327dd5a0abbb427ecd4fc82f99c2ceaa170bc61ecde12809b0c
-size 33384570

 version https://git-lfs.github.com/spec/v1
+oid sha256:4667f2089529e8e7657cfb6d1c19910ae71ff5f28aa7ab2ff2763330affad795
+size 33384568

tokenizer_config.json CHANGED Viewed

@@ -2160,7 +2160,7 @@
       "normalized": false,
       "rstrip": false,
       "single_word": false,
-      "special": false
     },
     "256000": {
       "content": "<end_of_image>",
@@ -2168,7 +2168,7 @@
       "normalized": false,
       "rstrip": false,
       "single_word": false,
-      "special": false
     },
     "256001": {
       "content": "<unused99>",
@@ -51325,17 +51325,20 @@
   },
   "boi_token": "<start_of_image>",
   "bos_token": "<bos>",
   "clean_up_tokenization_spaces": false,
   "eoi_token": "<end_of_image>",
-  "eos_token": "<eos>",
   "extra_special_tokens": {
     "boi_token": "<start_of_image>",
     "eoi_token": "<end_of_image>",
     "image_token": "<image_soft_token>"
   },
   "image_token": "<image_soft_token>",
-  "model_max_length": 1000000000000000019884624838656,
   "pad_token": "<pad>",
   "sp_model_kwargs": null,
   "spaces_between_special_tokens": false,
   "tokenizer_class": "GemmaTokenizer",

       "normalized": false,
       "rstrip": false,
       "single_word": false,
+      "special": true
     },
     "256000": {
       "content": "<end_of_image>",
       "normalized": false,
       "rstrip": false,
       "single_word": false,
+      "special": true
     },
     "256001": {
       "content": "<unused99>",
   },
   "boi_token": "<start_of_image>",
   "bos_token": "<bos>",
+  "chat_template": "{{ bos_token }}\n{%- if messages[0]['role'] == 'system' -%}\n    {%- if messages[0]['content'] is string -%}\n        {%- set first_user_prefix = messages[0]['content'] + '\n\n' -%}\n    {%- else -%}\n        {%- set first_user_prefix = messages[0]['content'][0]['text'] + '\n\n' -%}\n    {%- endif -%}\n    {%- set loop_messages = messages[1:] -%}\n{%- else -%}\n    {%- set first_user_prefix = \"\" -%}\n    {%- set loop_messages = messages -%}\n{%- endif -%}\n{%- for message in loop_messages -%}\n    {%- if (message['role'] == 'user') != (loop.index0 % 2 == 0) -%}\n        {{ raise_exception(\"Conversation roles must alternate user/assistant/user/assistant/...\") }}\n    {%- endif -%}\n    {%- if (message['role'] == 'assistant') -%}\n        {%- set role = \"model\" -%}\n    {%- else -%}\n        {%- set role = message['role'] -%}\n    {%- endif -%}\n    {{ '<start_of_turn>' + role + '\n' + (first_user_prefix if loop.first else \"\") }}\n    {%- if message['content'] is string -%}\n        {{ message['content'] | trim }}\n    {%- elif message['content'] is iterable -%}\n        {%- for item in message['content'] -%}\n            {%- if item['type'] == 'image' -%}\n                {{ '<start_of_image>' }}\n            {%- elif item['type'] == 'text' -%}\n                {{ item['text'] | trim }}\n            {%- endif -%}\n        {%- endfor -%}\n    {%- else -%}\n        {{ raise_exception(\"Invalid content type\") }}\n    {%- endif -%}\n    {{ '<end_of_turn>\n' }}\n{%- endfor -%}\n{%- if add_generation_prompt -%}\n    {{'<start_of_turn>model\n'}}\n{%- endif -%}\n",
   "clean_up_tokenization_spaces": false,
   "eoi_token": "<end_of_image>",
+  "eos_token": "<end_of_turn>",
   "extra_special_tokens": {
     "boi_token": "<start_of_image>",
     "eoi_token": "<end_of_image>",
     "image_token": "<image_soft_token>"
   },
   "image_token": "<image_soft_token>",
+  "model_max_length": 32768,
   "pad_token": "<pad>",
+  "padding_side": "right",
+  "processor_class": "Gemma3Processor",
   "sp_model_kwargs": null,
   "spaces_between_special_tokens": false,
   "tokenizer_class": "GemmaTokenizer",