Upload folder using huggingface_hub

Browse files

Files changed (11) hide show

.msc +0 -0
.mv +1 -1
README.md +20 -339
config.json +6 -4
model-00001-of-00005.safetensors +2 -2
model-00002-of-00005.safetensors +2 -2
model-00003-of-00005.safetensors +2 -2
model-00004-of-00005.safetensors +2 -2
model-00005-of-00005.safetensors +2 -2
model.safetensors.index.json +397 -253
quantize_config.json +6 -4

.msc CHANGED Viewed

Binary files a/.msc and b/.msc differ

.mv CHANGED Viewed

	@@ -1 +1 @@
1	- Revision:master,CreatedAt:~~1745983745~~


1	+ Revision:master,CreatedAt:1746673573

README.md CHANGED Viewed

@@ -1,354 +1,35 @@
----
-library_name: transformers
 license: apache-2.0
-license_link: https://huggingface.co/Qwen/Qwen3-4B/blob/main/LICENSE
-pipeline_tag: text-generation
-base_model:
-- Qwen/Qwen3-4B-Base
----
-# Qwen3-4B
-<a href="https://chat.qwen.ai/" target="_blank" style="margin: 2px;">
-    <img alt="Chat" src="https://img.shields.io/badge/%F0%9F%92%9C%EF%B8%8F%20Qwen%20Chat%20-536af5" style="display: inline-block; vertical-align: middle;"/>
-</a>
-## Qwen3 Highlights
-Qwen3 is the latest generation of large language models in Qwen series, offering a comprehensive suite of dense and mixture-of-experts (MoE) models. Built upon extensive training, Qwen3 delivers groundbreaking advancements in reasoning, instruction-following, agent capabilities, and multilingual support, with the following key features:
-- **Uniquely support of seamless switching between thinking mode** (for complex logical reasoning, math, and coding) and **non-thinking mode** (for efficient, general-purpose dialogue) **within single model**, ensuring optimal performance across various scenarios.
-- **Significantly enhancement in its reasoning capabilities**, surpassing previous QwQ (in thinking mode) and Qwen2.5 instruct models (in non-thinking mode) on mathematics, code generation, and commonsense logical reasoning.
-- **Superior human preference alignment**, excelling in creative writing, role-playing, multi-turn dialogues, and instruction following, to deliver a more natural, engaging, and immersive conversational experience.
-- **Expertise in agent capabilities**, enabling precise integration with external tools in both thinking and unthinking modes and achieving leading performance among open-source models in complex agent-based tasks.
-- **Support of 100+ languages and dialects** with strong capabilities for **multilingual instruction following** and **translation**.
-## Model Overview
-**Qwen3-4B** has the following features:
-- Type: Causal Language Models
-- Training Stage: Pretraining & Post-training
-- Number of Parameters: 4.0B
-- Number of Paramaters (Non-Embedding): 3.6B
-- Number of Layers: 36
-- Number of Attention Heads (GQA): 32 for Q and 8 for KV
-- Context Length: 32,768 natively and [131,072 tokens with YaRN](#processing-long-texts).
-For more details, including benchmark evaluation, hardware requirements, and inference performance, please refer to our [blog](https://qwenlm.github.io/blog/qwen3/), [GitHub](https://github.com/QwenLM/Qwen3), and [Documentation](https://qwen.readthedocs.io/en/latest/).
-> [!TIP]
-> If you encounter significant endless repetitions, please refer to the [Best Practices](#best-practices) section for optimal sampling parameters, and set the ``presence_penalty`` to 1.5.
-## Quickstart
-The code of Qwen3 has been in the latest Hugging Face `transformers` and we advise you to use the latest version of `transformers`.
-With `transformers<4.51.0`, you will encounter the following error:
-```
-KeyError: 'qwen3'
 ```
-The following contains a code snippet illustrating how to use the model generate content based on given inputs.
-```python
-from transformers import AutoModelForCausalLM, AutoTokenizer
-model_name = "Qwen/Qwen3-4B"
-# load the tokenizer and the model
-tokenizer = AutoTokenizer.from_pretrained(model_name)
-model = AutoModelForCausalLM.from_pretrained(
-    model_name,
-    torch_dtype="auto",
-    device_map="auto"
-)
-# prepare the model input
-prompt = "Give me a short introduction to large language model."
-messages = [
-    {"role": "user", "content": prompt}
-]
-text = tokenizer.apply_chat_template(
-    messages,
-    tokenize=False,
-    add_generation_prompt=True,
-    enable_thinking=True # Switches between thinking and non-thinking modes. Default is True.
-)
-model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
-# conduct text completion
-generated_ids = model.generate(
-    **model_inputs,
-    max_new_tokens=32768
-)
-output_ids = generated_ids[0][len(model_inputs.input_ids[0]):].tolist()
-# parsing thinking content
-try:
-    # rindex finding 151668 (</think>)
-    index = len(output_ids) - output_ids[::-1].index(151668)
-except ValueError:
-    index = 0
-thinking_content = tokenizer.decode(output_ids[:index], skip_special_tokens=True).strip("\n")
-content = tokenizer.decode(output_ids[index:], skip_special_tokens=True).strip("\n")
-print("thinking content:", thinking_content)
-print("content:", content)
 ```
-For deployment, you can use `sglang>=0.4.6.post1` or `vllm>=0.8.5` or to create an OpenAI-compatible API endpoint:
-- SGLang:
-    ```shell
-    python -m sglang.launch_server --model-path Qwen/Qwen3-4B --reasoning-parser qwen3
-    ```
-- vLLM:
-    ```shell
-    vllm serve Qwen/Qwen3-4B --enable-reasoning --reasoning-parser deepseek_r1
-    ```
-For local use, applications such as Ollama, LMStudio, MLX-LM, llama.cpp, and KTransformers have also supported Qwen3.
-## Switching Between Thinking and Non-Thinking Mode
-> [!TIP]
-> The `enable_thinking` switch is also available in APIs created by SGLang and vLLM.
-> Please refer to our documentation for [SGLang](https://qwen.readthedocs.io/en/latest/deployment/sglang.html#thinking-non-thinking-modes) and [vLLM](https://qwen.readthedocs.io/en/latest/deployment/vllm.html#thinking-non-thinking-modes) users.
-### `enable_thinking=True`
-By default, Qwen3 has thinking capabilities enabled, similar to QwQ-32B. This means the model will use its reasoning abilities to enhance the quality of generated responses. For example, when explicitly setting `enable_thinking=True` or leaving it as the default value in `tokenizer.apply_chat_template`, the model will engage its thinking mode.
-```python
-text = tokenizer.apply_chat_template(
-    messages,
-    tokenize=False,
-    add_generation_prompt=True,
-    enable_thinking=True  # True is the default value for enable_thinking
-)
 ```
-In this mode, the model will generate think content wrapped in a `<think>...</think>` block, followed by the final response.
-> [!NOTE]
-> For thinking mode, use `Temperature=0.6`, `TopP=0.95`, `TopK=20`, and `MinP=0` (the default setting in `generation_config.json`). **DO NOT use greedy decoding**, as it can lead to performance degradation and endless repetitions. For more detailed guidance, please refer to the [Best Practices](#best-practices) section.
-### `enable_thinking=False`
-We provide a hard switch to strictly disable the model's thinking behavior, aligning its functionality with the previous Qwen2.5-Instruct models. This mode is particularly useful in scenarios where disabling thinking is essential for enhancing efficiency.
-```python
-text = tokenizer.apply_chat_template(
-    messages,
-    tokenize=False,
-    add_generation_prompt=True,
-    enable_thinking=False  # Setting enable_thinking=False disables thinking mode
-)
 ```
-In this mode, the model will not generate any think content and will not include a `<think>...</think>` block.
-> [!NOTE]
-> For non-thinking mode, we suggest using `Temperature=0.7`, `TopP=0.8`, `TopK=20`, and `MinP=0`. For more detailed guidance, please refer to the [Best Practices](#best-practices) section.
-### Advanced Usage: Switching Between Thinking and Non-Thinking Modes via User Input
-We provide a soft switch mechanism that allows users to dynamically control the model's behavior when `enable_thinking=True`. Specifically, you can add `/think` and `/no_think` to user prompts or system messages to switch the model's thinking mode from turn to turn. The model will follow the most recent instruction in multi-turn conversations.
-Here is an example of a multi-turn conversation:
 ```python
-from transformers import AutoModelForCausalLM, AutoTokenizer
-class QwenChatbot:
-    def __init__(self, model_name="Qwen/Qwen3-4B"):
-        self.tokenizer = AutoTokenizer.from_pretrained(model_name)
-        self.model = AutoModelForCausalLM.from_pretrained(model_name)
-        self.history = []
-    def generate_response(self, user_input):
-        messages = self.history + [{"role": "user", "content": user_input}]
-        text = self.tokenizer.apply_chat_template(
-            messages,
-            tokenize=False,
-            add_generation_prompt=True
-        )
-        inputs = self.tokenizer(text, return_tensors="pt")
-        response_ids = self.model.generate(**inputs, max_new_tokens=32768)[0][len(inputs.input_ids[0]):].tolist()
-        response = self.tokenizer.decode(response_ids, skip_special_tokens=True)
-        # Update history
-        self.history.append({"role": "user", "content": user_input})
-        self.history.append({"role": "assistant", "content": response})
-        return response
-# Example Usage
-if __name__ == "__main__":
-    chatbot = QwenChatbot()
-    # First input (without /think or /no_think tags, thinking mode is enabled by default)
-    user_input_1 = "How many r's in strawberries?"
-    print(f"User: {user_input_1}")
-    response_1 = chatbot.generate_response(user_input_1)
-    print(f"Bot: {response_1}")
-    print("----------------------")
-    # Second input with /no_think
-    user_input_2 = "Then, how many r's in blueberries? /no_think"
-    print(f"User: {user_input_2}")
-    response_2 = chatbot.generate_response(user_input_2)
-    print(f"Bot: {response_2}")
-    print("----------------------")
-    # Third input with /think
-    user_input_3 = "Really? /think"
-    print(f"User: {user_input_3}")
-    response_3 = chatbot.generate_response(user_input_3)
-    print(f"Bot: {response_3}")
 ```
-> [!NOTE]
-> For API compatibility, when `enable_thinking=True`, regardless of whether the user uses `/think` or `/no_think`, the model will always output a block wrapped in `<think>...</think>`. However, the content inside this block may be empty if thinking is disabled.
-> When `enable_thinking=False`, the soft switches are not valid. Regardless of any `/think` or `/no_think` tags input by the user, the model will not generate think content and will not include a `<think>...</think>` block.
-## Agentic Use
-Qwen3 excels in tool calling capabilities. We recommend using [Qwen-Agent](https://github.com/QwenLM/Qwen-Agent) to make the best use of agentic ability of Qwen3. Qwen-Agent encapsulates tool-calling templates and tool-calling parsers internally, greatly reducing coding complexity.
-To define the available tools, you can use the MCP configuration file, use the integrated tool of Qwen-Agent, or integrate other tools by yourself.
-```python
-from qwen_agent.agents import Assistant
-# Define LLM
-llm_cfg = {
-    'model': 'Qwen3-4B',
-    # Use the endpoint provided by Alibaba Model Studio:
-    # 'model_type': 'qwen_dashscope',
-    # 'api_key': os.getenv('DASHSCOPE_API_KEY'),
-    # Use a custom endpoint compatible with OpenAI API:
-    'model_server': 'http://localhost:8000/v1',  # api_base
-    'api_key': 'EMPTY',
-    # Other parameters:
-    # 'generate_cfg': {
-    #         # Add: When the response content is `<think>this is the thought</think>this is the answer;
-    #         # Do not add: When the response has been separated by reasoning_content and content.
-    #         'thought_in_content': True,
-    #     },
-}
-# Define Tools
-tools = [
-    {'mcpServers': {  # You can specify the MCP configuration file
-            'time': {
-                'command': 'uvx',
-                'args': ['mcp-server-time', '--local-timezone=Asia/Shanghai']
-            },
-            "fetch": {
-                "command": "uvx",
-                "args": ["mcp-server-fetch"]
-            }
-        }
-    },
-  'code_interpreter',  # Built-in tools
-]
-# Define Agent
-bot = Assistant(llm=llm_cfg, function_list=tools)
-# Streaming generation
-messages = [{'role': 'user', 'content': 'https://qwenlm.github.io/blog/ Introduce the latest developments of Qwen'}]
-for responses in bot.run(messages=messages):
-    pass
-print(responses)
 ```
-## Processing Long Texts
-Qwen3 natively supports context lengths of up to 32,768 tokens. For conversations where the total length (including both input and output) significantly exceeds this limit, we recommend using RoPE scaling techniques to handle long texts effectively. We have validated the model's performance on context lengths of up to 131,072 tokens using the [YaRN](https://arxiv.org/abs/2309.00071) method.
-YaRN is currently supported by several inference frameworks, e.g., `transformers` and `llama.cpp` for local use, `vllm` and `sglang` for deployment. In general, there are two approaches to enabling YaRN for supported frameworks:
-- Modifying the model files:
-  In the `config.json` file, add the `rope_scaling` fields:
-    ```json
-    {
-        ...,
-        "rope_scaling": {
-            "rope_type": "yarn",
-            "factor": 4.0,
-            "original_max_position_embeddings": 32768
-        }
-    }
-    ```
-  For `llama.cpp`, you need to regenerate the GGUF file after the modification.
-- Passing command line arguments:
-  For `vllm`, you can use
-    ```shell
-    vllm serve ... --rope-scaling '{"rope_type":"yarn","factor":4.0,"original_max_position_embeddings":32768}' --max-model-len 131072
-    ```
-  For `sglang`, you can use
-    ```shell
-    python -m sglang.launch_server ... --json-model-override-args '{"rope_scaling":{"rope_type":"yarn","factor":4.0,"original_max_position_embeddings":32768}}'
-    ```
-  For `llama-server` from `llama.cpp`, you can use
-    ```shell
-    llama-server ... --rope-scaling yarn --rope-scale 4 --yarn-orig-ctx 32768
-    ```
-> [!IMPORTANT]
-> If you encounter the following warning
-> ```
-> Unrecognized keys in `rope_scaling` for 'rope_type'='yarn': {'original_max_position_embeddings'}
-> ```
-> please upgrade `transformers>=4.51.0`.
-> [!NOTE]
-> All the notable open-source frameworks implement static YaRN, which means the scaling factor remains constant regardless of input length, **potentially impacting performance on shorter texts.**
-> We advise adding the `rope_scaling` configuration only when processing long contexts is required.
-> It is also recommended to modify the `factor` as needed. For example, if the typical context length for your application is 65,536 tokens, it would be better to set `factor` as 2.0.
-> [!NOTE]
-> The default `max_position_embeddings` in `config.json` is set to 40,960. This allocation includes reserving 32,768 tokens for outputs and 8,192 tokens for typical prompts, which is sufficient for most scenarios involving short text processing. If the average context length does not exceed 32,768 tokens, we do not recommend enabling YaRN in this scenario, as it may potentially degrade model performance.
-> [!TIP]
-> The endpoint provided by Alibaba Model Studio supports dynamic YaRN by default and no extra configuration is needed.
-## Best Practices
-To achieve optimal performance, we recommend the following settings:
-1. **Sampling Parameters**:
-   - For thinking mode (`enable_thinking=True`), use `Temperature=0.6`, `TopP=0.95`, `TopK=20`, and `MinP=0`. **DO NOT use greedy decoding**, as it can lead to performance degradation and endless repetitions.
-   - For non-thinking mode (`enable_thinking=False`), we suggest using `Temperature=0.7`, `TopP=0.8`, `TopK=20`, and `MinP=0`.
-   - For supported frameworks, you can adjust the `presence_penalty` parameter between 0 and 2 to reduce endless repetitions. However, using a higher value may occasionally result in language mixing and a slight decrease in model performance.
-2. **Adequate Output Length**: We recommend using an output length of 32,768 tokens for most queries. For benchmarking on highly complex problems, such as those found in math and programming competitions, we suggest setting the max output length to 38,912 tokens. This provides the model with sufficient space to generate detailed and comprehensive responses, thereby enhancing its overall performance.
-3. **Standardize Output Format**: We recommend using prompts to standardize model outputs when benchmarking.
-   - **Math Problems**: Include "Please reason step by step, and put your final answer within \boxed{}." in the prompt.
-   - **Multiple-Choice Questions**: Add the following JSON structure to the prompt to standardize responses: "Please show your choice in the `answer` field with only the choice letter, e.g., `"answer": "C"`."
-4. **No Thinking Content in History**: In multi-turn conversations, the historical model output should only include the final output part and does not need to include the thinking content. It is implemented in the provided chat template in Jinja2. However, for frameworks that do not directly use the Jinja2 chat template, it is up to the developers to ensure that the best practice is followed.
-### Citation
-If you find our work helpful, feel free to give us a cite.
 ```
-@misc{qwen3,
-    title  = {Qwen3},
-    url    = {https://qwenlm.github.io/blog/qwen3/},
-    author = {Qwen Team},
-    month  = {April},
-    year   = {2025}
-}
-```

 license: apache-2.0
+# 通义千问Qwen3-30B-A3B-GPTQ-Int4量化
+基础模型 [通义千问3-30B-A3B](https://modelscope.cn/models/Qwen/Qwen3-30B-A3B)
+### 最近更新
+```
+2025-05-08
+fix (model.layers.*.mlp.gate) are not quantized
 ```
+### 依赖
 ```
+vllm==0.8.5
 ```
+SDK下载
+```bash
+#安装ModelScope
+pip install modelscope
 ```
 ```python
+#SDK模型下载
+from modelscope import snapshot_download
+model_dir = snapshot_download('JunHowie/Qwen3-30B-A3B-GPTQ-Int4')
 ```
+Git下载
 ```
+#Git模型下载
+git clone https://www.modelscope.cn/JunHowie/Qwen3-30B-A3B-GPTQ-Int4.git
 ```
+<p style="color: lightgrey;">如果您是本模型的贡献者，我们邀请您根据<a href="https://modelscope.cn/docs/ModelScope%E6%A8%A1%E5%9E%8B%E6%8E%A5%E5%85%A5%E6%B5%81%E7%A8%8B%E6%A6%82%E8%A7%88" style="color: lightgrey; text-decoration: underline;">模型贡献文档</a>，及时完善模型卡片内容。</p>

config.json CHANGED Viewed

@@ -31,15 +31,17 @@
     "group_size": 128,
     "lm_head": false,
     "meta": {
-      "damp_auto_increment": 0.0025,
-      "damp_percent": 0.01,
       "mse": 0.0,
       "quantizer": [
-        "gptqmodel:2.2.0"
       ],
       "static_groups": false,
       "true_sequential": true,
-      "uri": "https://github.com/modelcloud/gptqmodel"
     },
     "pack_dtype": "int32",
     "quant_method": "gptq",

     "group_size": 128,
     "lm_head": false,
     "meta": {
+      "damp_auto_increment": 0.01,
+      "damp_percent": 0.05,
       "mse": 0.0,
       "quantizer": [
+        "gptqmodel:4.0.0-dev"
       ],
       "static_groups": false,
       "true_sequential": true,
+      "uri": "https://github.com/modelcloud/gptqmodel",
+      "v2": false,
+      "v2_alpha": 0.25
     },
     "pack_dtype": "int32",
     "quant_method": "gptq",

model-00001-of-00005.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7e3faf1da5e6f718ead6172a721bb78716057b6aae09f60d4251d225580e0dc7
-size 4001671816

 version https://git-lfs.github.com/spec/v1
+oid sha256:15e5be8644a3e4c3ad1f05b48d6caf6c57d09772085dc9142a5560c4d2b7b242
+size 4001615168

model-00002-of-00005.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fbf579aa1ceb1ecda8d7359f8ee278ccf24f8b5a72e9b0ff55f43ee291178674
-size 4002063104

 version https://git-lfs.github.com/spec/v1
+oid sha256:621653d6bc683384afa8df31474c531a31012df22f9b33ebcb5cc1335dd9d070
+size 4001632008

model-00003-of-00005.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ef5532d2e50ab7e732432ba20852b93e351feede7b51afe7ad16dc214e6822c5
-size 4002068288

 version https://git-lfs.github.com/spec/v1
+oid sha256:84eaf9be046f6dd2a8c73b8d806e3cb7c3b0f7f1eac788f9c7922aa8ef31a0bb
+size 4001632136

model-00004-of-00005.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c0057666952e9e82931b9bce81bd28919025234b7154869ccc311f9b9806b519
-size 4001735352

 version https://git-lfs.github.com/spec/v1
+oid sha256:9103e328ced3707a04fd14fdacf59c12d58e512f8a1004310b342787ca52ae55
+size 4001745272

model-00005-of-00005.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:87b1cd78b43ed9faba2d74d2e261c1a5350dd850e2e3b92fe4f7fbac8d1c7b1b
-size 925613664

 version https://git-lfs.github.com/spec/v1
+oid sha256:504462bea741d0e85d5cfc85989bb2f20eac5671caca96d5fa537d39bbc94de3
+size 908307360

model.safetensors.index.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "metadata": {
-    "total_size": 16924176384
   },
   "weight_map": {
     "lm_head.weight": "model-00005-of-00005.safetensors",
@@ -1542,7 +1542,10 @@
     "model.layers.0.mlp.experts.99.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.0.mlp.experts.99.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.0.mlp.experts.99.up_proj.scales": "model-00001-of-00005.safetensors",
-    "model.layers.0.mlp.gate.weight": "model-00001-of-00005.safetensors",
     "model.layers.0.post_attention_layernorm.weight": "model-00001-of-00005.safetensors",
     "model.layers.0.self_attn.k_norm.weight": "model-00001-of-00005.safetensors",
     "model.layers.0.self_attn.k_proj.g_idx": "model-00001-of-00005.safetensors",
@@ -3099,7 +3102,10 @@
     "model.layers.1.mlp.experts.99.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.1.mlp.experts.99.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.1.mlp.experts.99.up_proj.scales": "model-00001-of-00005.safetensors",
-    "model.layers.1.mlp.gate.weight": "model-00001-of-00005.safetensors",
     "model.layers.1.post_attention_layernorm.weight": "model-00001-of-00005.safetensors",
     "model.layers.1.self_attn.k_norm.weight": "model-00001-of-00005.safetensors",
     "model.layers.1.self_attn.k_proj.g_idx": "model-00001-of-00005.safetensors",
@@ -3876,10 +3882,10 @@
     "model.layers.10.mlp.experts.4.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.10.mlp.experts.4.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.10.mlp.experts.4.up_proj.scales": "model-00001-of-00005.safetensors",
-    "model.layers.10.mlp.experts.40.down_proj.g_idx": "model-00002-of-00005.safetensors",
-    "model.layers.10.mlp.experts.40.down_proj.qweight": "model-00002-of-00005.safetensors",
-    "model.layers.10.mlp.experts.40.down_proj.qzeros": "model-00002-of-00005.safetensors",
-    "model.layers.10.mlp.experts.40.down_proj.scales": "model-00002-of-00005.safetensors",
     "model.layers.10.mlp.experts.40.gate_proj.g_idx": "model-00001-of-00005.safetensors",
     "model.layers.10.mlp.experts.40.gate_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.10.mlp.experts.40.gate_proj.qzeros": "model-00001-of-00005.safetensors",
@@ -3888,26 +3894,26 @@
     "model.layers.10.mlp.experts.40.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.10.mlp.experts.40.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.10.mlp.experts.40.up_proj.scales": "model-00001-of-00005.safetensors",
-    "model.layers.10.mlp.experts.41.down_proj.g_idx": "model-00002-of-00005.safetensors",
-    "model.layers.10.mlp.experts.41.down_proj.qweight": "model-00002-of-00005.safetensors",
-    "model.layers.10.mlp.experts.41.down_proj.qzeros": "model-00002-of-00005.safetensors",
-    "model.layers.10.mlp.experts.41.down_proj.scales": "model-00002-of-00005.safetensors",
-    "model.layers.10.mlp.experts.41.gate_proj.g_idx": "model-00002-of-00005.safetensors",
-    "model.layers.10.mlp.experts.41.gate_proj.qweight": "model-00002-of-00005.safetensors",
-    "model.layers.10.mlp.experts.41.gate_proj.qzeros": "model-00002-of-00005.safetensors",
-    "model.layers.10.mlp.experts.41.gate_proj.scales": "model-00002-of-00005.safetensors",
-    "model.layers.10.mlp.experts.41.up_proj.g_idx": "model-00002-of-00005.safetensors",
-    "model.layers.10.mlp.experts.41.up_proj.qweight": "model-00002-of-00005.safetensors",
-    "model.layers.10.mlp.experts.41.up_proj.qzeros": "model-00002-of-00005.safetensors",
-    "model.layers.10.mlp.experts.41.up_proj.scales": "model-00002-of-00005.safetensors",
     "model.layers.10.mlp.experts.42.down_proj.g_idx": "model-00002-of-00005.safetensors",
     "model.layers.10.mlp.experts.42.down_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.10.mlp.experts.42.down_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.10.mlp.experts.42.down_proj.scales": "model-00002-of-00005.safetensors",
-    "model.layers.10.mlp.experts.42.gate_proj.g_idx": "model-00002-of-00005.safetensors",
-    "model.layers.10.mlp.experts.42.gate_proj.qweight": "model-00002-of-00005.safetensors",
-    "model.layers.10.mlp.experts.42.gate_proj.qzeros": "model-00002-of-00005.safetensors",
-    "model.layers.10.mlp.experts.42.gate_proj.scales": "model-00002-of-00005.safetensors",
     "model.layers.10.mlp.experts.42.up_proj.g_idx": "model-00002-of-00005.safetensors",
     "model.layers.10.mlp.experts.42.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.10.mlp.experts.42.up_proj.qzeros": "model-00002-of-00005.safetensors",
@@ -4656,7 +4662,10 @@
     "model.layers.10.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.10.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.10.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
-    "model.layers.10.mlp.gate.weight": "model-00001-of-00005.safetensors",
     "model.layers.10.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.10.self_attn.k_norm.weight": "model-00001-of-00005.safetensors",
     "model.layers.10.self_attn.k_proj.g_idx": "model-00001-of-00005.safetensors",
@@ -6213,7 +6222,10 @@
     "model.layers.11.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.11.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.11.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
-    "model.layers.11.mlp.gate.weight": "model-00002-of-00005.safetensors",
     "model.layers.11.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.11.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.11.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
@@ -7770,7 +7782,10 @@
     "model.layers.12.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.12.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.12.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
-    "model.layers.12.mlp.gate.weight": "model-00002-of-00005.safetensors",
     "model.layers.12.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.12.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.12.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
@@ -9327,7 +9342,10 @@
     "model.layers.13.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.13.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.13.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
-    "model.layers.13.mlp.gate.weight": "model-00002-of-00005.safetensors",
     "model.layers.13.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.13.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.13.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
@@ -10884,7 +10902,10 @@
     "model.layers.14.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.14.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.14.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
-    "model.layers.14.mlp.gate.weight": "model-00002-of-00005.safetensors",
     "model.layers.14.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.14.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.14.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
@@ -12441,7 +12462,10 @@
     "model.layers.15.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.15.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.15.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
-    "model.layers.15.mlp.gate.weight": "model-00002-of-00005.safetensors",
     "model.layers.15.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.15.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.15.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
@@ -13998,7 +14022,10 @@
     "model.layers.16.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.16.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.16.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
-    "model.layers.16.mlp.gate.weight": "model-00002-of-00005.safetensors",
     "model.layers.16.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.16.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.16.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
@@ -15555,7 +15582,10 @@
     "model.layers.17.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.17.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.17.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
-    "model.layers.17.mlp.gate.weight": "model-00002-of-00005.safetensors",
     "model.layers.17.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.17.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.17.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
@@ -17112,7 +17142,10 @@
     "model.layers.18.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.18.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.18.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
-    "model.layers.18.mlp.gate.weight": "model-00002-of-00005.safetensors",
     "model.layers.18.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.18.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.18.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
@@ -18669,7 +18702,10 @@
     "model.layers.19.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.19.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.19.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
-    "model.layers.19.mlp.gate.weight": "model-00002-of-00005.safetensors",
     "model.layers.19.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.19.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.19.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
@@ -20226,7 +20262,10 @@
     "model.layers.2.mlp.experts.99.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.2.mlp.experts.99.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.2.mlp.experts.99.up_proj.scales": "model-00001-of-00005.safetensors",
-    "model.layers.2.mlp.gate.weight": "model-00001-of-00005.safetensors",
     "model.layers.2.post_attention_layernorm.weight": "model-00001-of-00005.safetensors",
     "model.layers.2.self_attn.k_norm.weight": "model-00001-of-00005.safetensors",
     "model.layers.2.self_attn.k_proj.g_idx": "model-00001-of-00005.safetensors",
@@ -21783,7 +21822,10 @@
     "model.layers.20.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.20.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.20.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
-    "model.layers.20.mlp.gate.weight": "model-00002-of-00005.safetensors",
     "model.layers.20.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.20.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.20.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
@@ -23340,7 +23382,10 @@
     "model.layers.21.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.21.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.21.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
-    "model.layers.21.mlp.gate.weight": "model-00002-of-00005.safetensors",
     "model.layers.21.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.21.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.21.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
@@ -24549,50 +24594,50 @@
     "model.layers.22.mlp.experts.72.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.22.mlp.experts.72.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.22.mlp.experts.72.up_proj.scales": "model-00002-of-00005.safetensors",
-    "model.layers.22.mlp.experts.73.down_proj.g_idx": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.73.down_proj.qweight": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.73.down_proj.qzeros": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.73.down_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.73.gate_proj.g_idx": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.73.gate_proj.qweight": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.73.gate_proj.qzeros": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.73.gate_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.73.up_proj.g_idx": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.73.up_proj.qweight": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.73.up_proj.qzeros": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.73.up_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.74.down_proj.g_idx": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.74.down_proj.qweight": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.74.down_proj.qzeros": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.74.down_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.74.gate_proj.g_idx": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.74.gate_proj.qweight": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.74.gate_proj.qzeros": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.74.gate_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.74.up_proj.g_idx": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.74.up_proj.qweight": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.74.up_proj.qzeros": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.74.up_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.75.down_proj.g_idx": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.75.down_proj.qweight": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.75.down_proj.qzeros": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.75.down_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.75.gate_proj.g_idx": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.75.gate_proj.qweight": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.75.gate_proj.qzeros": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.75.gate_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.75.up_proj.g_idx": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.75.up_proj.qweight": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.75.up_proj.qzeros": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.75.up_proj.scales": "model-00003-of-00005.safetensors",
     "model.layers.22.mlp.experts.76.down_proj.g_idx": "model-00003-of-00005.safetensors",
     "model.layers.22.mlp.experts.76.down_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.22.mlp.experts.76.down_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.22.mlp.experts.76.down_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.76.gate_proj.g_idx": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.76.gate_proj.qweight": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.76.gate_proj.qzeros": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.experts.76.gate_proj.scales": "model-00003-of-00005.safetensors",
     "model.layers.22.mlp.experts.76.up_proj.g_idx": "model-00003-of-00005.safetensors",
     "model.layers.22.mlp.experts.76.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.22.mlp.experts.76.up_proj.qzeros": "model-00003-of-00005.safetensors",
@@ -24897,7 +24942,10 @@
     "model.layers.22.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.22.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.22.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.22.mlp.gate.weight": "model-00002-of-00005.safetensors",
     "model.layers.22.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.22.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.22.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
@@ -26454,7 +26502,10 @@
     "model.layers.23.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.23.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.23.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.23.mlp.gate.weight": "model-00003-of-00005.safetensors",
     "model.layers.23.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.23.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.23.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
@@ -28011,7 +28062,10 @@
     "model.layers.24.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.24.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.24.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.24.mlp.gate.weight": "model-00003-of-00005.safetensors",
     "model.layers.24.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.24.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.24.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
@@ -29568,7 +29622,10 @@
     "model.layers.25.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.25.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.25.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.25.mlp.gate.weight": "model-00003-of-00005.safetensors",
     "model.layers.25.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.25.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.25.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
@@ -31125,7 +31182,10 @@
     "model.layers.26.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.26.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.26.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.26.mlp.gate.weight": "model-00003-of-00005.safetensors",
     "model.layers.26.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.26.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.26.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
@@ -32682,7 +32742,10 @@
     "model.layers.27.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.27.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.27.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.27.mlp.gate.weight": "model-00003-of-00005.safetensors",
     "model.layers.27.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.27.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.27.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
@@ -34239,7 +34302,10 @@
     "model.layers.28.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.28.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.28.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.28.mlp.gate.weight": "model-00003-of-00005.safetensors",
     "model.layers.28.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.28.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.28.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
@@ -35796,7 +35862,10 @@
     "model.layers.29.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.29.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.29.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.29.mlp.gate.weight": "model-00003-of-00005.safetensors",
     "model.layers.29.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.29.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.29.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
@@ -37353,7 +37422,10 @@
     "model.layers.3.mlp.experts.99.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.3.mlp.experts.99.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.3.mlp.experts.99.up_proj.scales": "model-00001-of-00005.safetensors",
-    "model.layers.3.mlp.gate.weight": "model-00001-of-00005.safetensors",
     "model.layers.3.post_attention_layernorm.weight": "model-00001-of-00005.safetensors",
     "model.layers.3.self_attn.k_norm.weight": "model-00001-of-00005.safetensors",
     "model.layers.3.self_attn.k_proj.g_idx": "model-00001-of-00005.safetensors",
@@ -38910,7 +38982,10 @@
     "model.layers.30.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.30.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.30.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.30.mlp.gate.weight": "model-00003-of-00005.safetensors",
     "model.layers.30.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.30.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.30.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
@@ -40467,7 +40542,10 @@
     "model.layers.31.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.31.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.31.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.31.mlp.gate.weight": "model-00003-of-00005.safetensors",
     "model.layers.31.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.31.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.31.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
@@ -42024,7 +42102,10 @@
     "model.layers.32.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.32.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.32.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.32.mlp.gate.weight": "model-00003-of-00005.safetensors",
     "model.layers.32.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.32.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.32.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
@@ -43581,7 +43662,10 @@
     "model.layers.33.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.33.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.33.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.33.mlp.gate.weight": "model-00003-of-00005.safetensors",
     "model.layers.33.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.33.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.33.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
@@ -43698,66 +43782,66 @@
     "model.layers.34.mlp.experts.104.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.104.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.104.up_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.34.mlp.experts.105.down_proj.g_idx": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.105.down_proj.qweight": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.105.down_proj.qzeros": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.105.down_proj.scales": "model-00004-of-00005.safetensors",
     "model.layers.34.mlp.experts.105.gate_proj.g_idx": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.105.gate_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.105.gate_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.105.gate_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.34.mlp.experts.105.up_proj.g_idx": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.105.up_proj.qweight": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.105.up_proj.qzeros": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.105.up_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.106.down_proj.g_idx": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.106.down_proj.qweight": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.106.down_proj.qzeros": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.106.down_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.106.gate_proj.g_idx": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.106.gate_proj.qweight": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.106.gate_proj.qzeros": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.106.gate_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.106.up_proj.g_idx": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.106.up_proj.qweight": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.106.up_proj.qzeros": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.106.up_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.107.down_proj.g_idx": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.107.down_proj.qweight": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.107.down_proj.qzeros": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.107.down_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.107.gate_proj.g_idx": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.107.gate_proj.qweight": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.107.gate_proj.qzeros": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.107.gate_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.107.up_proj.g_idx": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.107.up_proj.qweight": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.107.up_proj.qzeros": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.107.up_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.108.down_proj.g_idx": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.108.down_proj.qweight": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.108.down_proj.qzeros": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.108.down_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.108.gate_proj.g_idx": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.108.gate_proj.qweight": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.108.gate_proj.qzeros": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.108.gate_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.108.up_proj.g_idx": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.108.up_proj.qweight": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.108.up_proj.qzeros": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.108.up_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.109.down_proj.g_idx": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.109.down_proj.qweight": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.109.down_proj.qzeros": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.109.down_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.109.gate_proj.g_idx": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.109.gate_proj.qweight": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.109.gate_proj.qzeros": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.109.gate_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.109.up_proj.g_idx": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.109.up_proj.qweight": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.109.up_proj.qzeros": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.109.up_proj.scales": "model-00004-of-00005.safetensors",
     "model.layers.34.mlp.experts.11.down_proj.g_idx": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.11.down_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.11.down_proj.qzeros": "model-00003-of-00005.safetensors",
@@ -43774,10 +43858,10 @@
     "model.layers.34.mlp.experts.110.down_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.34.mlp.experts.110.down_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.34.mlp.experts.110.down_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.110.gate_proj.g_idx": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.110.gate_proj.qweight": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.110.gate_proj.qzeros": "model-00004-of-00005.safetensors",
-    "model.layers.34.mlp.experts.110.gate_proj.scales": "model-00004-of-00005.safetensors",
     "model.layers.34.mlp.experts.110.up_proj.g_idx": "model-00004-of-00005.safetensors",
     "model.layers.34.mlp.experts.110.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.34.mlp.experts.110.up_proj.qzeros": "model-00004-of-00005.safetensors",
@@ -45138,7 +45222,10 @@
     "model.layers.34.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
-    "model.layers.34.mlp.gate.weight": "model-00003-of-00005.safetensors",
     "model.layers.34.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.34.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.34.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
@@ -46695,7 +46782,10 @@
     "model.layers.35.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.35.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.35.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.35.mlp.gate.weight": "model-00004-of-00005.safetensors",
     "model.layers.35.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.35.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.35.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
@@ -48252,7 +48342,10 @@
     "model.layers.36.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.36.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.36.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.36.mlp.gate.weight": "model-00004-of-00005.safetensors",
     "model.layers.36.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.36.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.36.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
@@ -49809,7 +49902,10 @@
     "model.layers.37.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.37.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.37.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.37.mlp.gate.weight": "model-00004-of-00005.safetensors",
     "model.layers.37.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.37.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.37.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
@@ -51366,7 +51462,10 @@
     "model.layers.38.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.38.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.38.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.38.mlp.gate.weight": "model-00004-of-00005.safetensors",
     "model.layers.38.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.38.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.38.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
@@ -52923,7 +53022,10 @@
     "model.layers.39.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.39.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.39.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.39.mlp.gate.weight": "model-00004-of-00005.safetensors",
     "model.layers.39.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.39.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.39.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
@@ -54480,7 +54582,10 @@
     "model.layers.4.mlp.experts.99.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.4.mlp.experts.99.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.4.mlp.experts.99.up_proj.scales": "model-00001-of-00005.safetensors",
-    "model.layers.4.mlp.gate.weight": "model-00001-of-00005.safetensors",
     "model.layers.4.post_attention_layernorm.weight": "model-00001-of-00005.safetensors",
     "model.layers.4.self_attn.k_norm.weight": "model-00001-of-00005.safetensors",
     "model.layers.4.self_attn.k_proj.g_idx": "model-00001-of-00005.safetensors",
@@ -56037,7 +56142,10 @@
     "model.layers.40.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.40.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.40.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.40.mlp.gate.weight": "model-00004-of-00005.safetensors",
     "model.layers.40.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.40.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.40.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
@@ -57594,7 +57702,10 @@
     "model.layers.41.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.41.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.41.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.41.mlp.gate.weight": "model-00004-of-00005.safetensors",
     "model.layers.41.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.41.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.41.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
@@ -59151,7 +59262,10 @@
     "model.layers.42.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.42.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.42.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.42.mlp.gate.weight": "model-00004-of-00005.safetensors",
     "model.layers.42.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.42.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.42.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
@@ -60708,7 +60822,10 @@
     "model.layers.43.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.43.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.43.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.43.mlp.gate.weight": "model-00004-of-00005.safetensors",
     "model.layers.43.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.43.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.43.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
@@ -62265,7 +62382,10 @@
     "model.layers.44.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.44.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.44.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.44.mlp.gate.weight": "model-00004-of-00005.safetensors",
     "model.layers.44.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.44.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.44.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
@@ -63822,7 +63942,10 @@
     "model.layers.45.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.45.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.45.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.45.mlp.gate.weight": "model-00004-of-00005.safetensors",
     "model.layers.45.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.45.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.45.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
@@ -65379,7 +65502,10 @@
     "model.layers.46.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.46.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.46.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.46.mlp.gate.weight": "model-00004-of-00005.safetensors",
     "model.layers.46.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.46.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.46.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
@@ -65424,18 +65550,18 @@
     "model.layers.47.mlp.experts.1.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.47.mlp.experts.1.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.47.mlp.experts.1.up_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.47.mlp.experts.10.down_proj.g_idx": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.10.down_proj.qweight": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.10.down_proj.qzeros": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.10.down_proj.scales": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.10.gate_proj.g_idx": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.10.gate_proj.qweight": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.10.gate_proj.qzeros": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.10.gate_proj.scales": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.10.up_proj.g_idx": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.10.up_proj.qweight": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.10.up_proj.qzeros": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.10.up_proj.scales": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.100.down_proj.g_idx": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.100.down_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.100.down_proj.qzeros": "model-00005-of-00005.safetensors",
@@ -65556,18 +65682,18 @@
     "model.layers.47.mlp.experts.109.up_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.109.up_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.109.up_proj.scales": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.11.down_proj.g_idx": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.11.down_proj.qweight": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.11.down_proj.qzeros": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.11.down_proj.scales": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.11.gate_proj.g_idx": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.11.gate_proj.qweight": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.11.gate_proj.qzeros": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.11.gate_proj.scales": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.11.up_proj.g_idx": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.11.up_proj.qweight": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.11.up_proj.qzeros": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.11.up_proj.scales": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.110.down_proj.g_idx": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.110.down_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.110.down_proj.qzeros": "model-00005-of-00005.safetensors",
@@ -65692,10 +65818,10 @@
     "model.layers.47.mlp.experts.12.down_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.12.down_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.12.down_proj.scales": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.12.gate_proj.g_idx": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.12.gate_proj.qweight": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.12.gate_proj.qzeros": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.12.gate_proj.scales": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.12.up_proj.g_idx": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.12.up_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.12.up_proj.qzeros": "model-00005-of-00005.safetensors",
@@ -66276,18 +66402,18 @@
     "model.layers.47.mlp.experts.49.up_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.49.up_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.49.up_proj.scales": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.5.down_proj.g_idx": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.5.down_proj.qweight": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.5.down_proj.qzeros": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.5.down_proj.scales": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.5.gate_proj.g_idx": "model-00004-of-00005.safetensors",
     "model.layers.47.mlp.experts.5.gate_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.47.mlp.experts.5.gate_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.47.mlp.experts.5.gate_proj.scales": "model-00004-of-00005.safetensors",
-    "model.layers.47.mlp.experts.5.up_proj.g_idx": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.5.up_proj.qweight": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.5.up_proj.qzeros": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.5.up_proj.scales": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.50.down_proj.g_idx": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.50.down_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.50.down_proj.qzeros": "model-00005-of-00005.safetensors",
@@ -66408,18 +66534,18 @@
     "model.layers.47.mlp.experts.59.up_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.59.up_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.59.up_proj.scales": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.6.down_proj.g_idx": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.6.down_proj.qweight": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.6.down_proj.qzeros": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.6.down_proj.scales": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.6.gate_proj.g_idx": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.6.gate_proj.qweight": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.6.gate_proj.qzeros": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.6.gate_proj.scales": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.6.up_proj.g_idx": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.6.up_proj.qweight": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.6.up_proj.qzeros": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.6.up_proj.scales": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.60.down_proj.g_idx": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.60.down_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.60.down_proj.qzeros": "model-00005-of-00005.safetensors",
@@ -66540,18 +66666,18 @@
     "model.layers.47.mlp.experts.69.up_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.69.up_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.69.up_proj.scales": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.7.down_proj.g_idx": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.7.down_proj.qweight": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.7.down_proj.qzeros": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.7.down_proj.scales": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.7.gate_proj.g_idx": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.7.gate_proj.qweight": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.7.gate_proj.qzeros": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.7.gate_proj.scales": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.7.up_proj.g_idx": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.7.up_proj.qweight": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.7.up_proj.qzeros": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.7.up_proj.scales": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.70.down_proj.g_idx": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.70.down_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.70.down_proj.qzeros": "model-00005-of-00005.safetensors",
@@ -66672,18 +66798,18 @@
     "model.layers.47.mlp.experts.79.up_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.79.up_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.79.up_proj.scales": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.8.down_proj.g_idx": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.8.down_proj.qweight": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.8.down_proj.qzeros": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.8.down_proj.scales": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.8.gate_proj.g_idx": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.8.gate_proj.qweight": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.8.gate_proj.qzeros": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.8.gate_proj.scales": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.8.up_proj.g_idx": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.8.up_proj.qweight": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.8.up_proj.qzeros": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.8.up_proj.scales": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.80.down_proj.g_idx": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.80.down_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.80.down_proj.qzeros": "model-00005-of-00005.safetensors",
@@ -66804,18 +66930,18 @@
     "model.layers.47.mlp.experts.89.up_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.89.up_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.89.up_proj.scales": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.9.down_proj.g_idx": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.9.down_proj.qweight": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.9.down_proj.qzeros": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.9.down_proj.scales": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.9.gate_proj.g_idx": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.9.gate_proj.qweight": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.9.gate_proj.qzeros": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.9.gate_proj.scales": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.9.up_proj.g_idx": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.9.up_proj.qweight": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.9.up_proj.qzeros": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.experts.9.up_proj.scales": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.90.down_proj.g_idx": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.90.down_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.90.down_proj.qzeros": "model-00005-of-00005.safetensors",
@@ -66936,7 +67062,10 @@
     "model.layers.47.mlp.experts.99.up_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.99.up_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.99.up_proj.scales": "model-00005-of-00005.safetensors",
-    "model.layers.47.mlp.gate.weight": "model-00004-of-00005.safetensors",
     "model.layers.47.post_attention_layernorm.weight": "model-00005-of-00005.safetensors",
     "model.layers.47.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.47.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
@@ -68493,7 +68622,10 @@
     "model.layers.5.mlp.experts.99.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.5.mlp.experts.99.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.5.mlp.experts.99.up_proj.scales": "model-00001-of-00005.safetensors",
-    "model.layers.5.mlp.gate.weight": "model-00001-of-00005.safetensors",
     "model.layers.5.post_attention_layernorm.weight": "model-00001-of-00005.safetensors",
     "model.layers.5.self_attn.k_norm.weight": "model-00001-of-00005.safetensors",
     "model.layers.5.self_attn.k_proj.g_idx": "model-00001-of-00005.safetensors",
@@ -70050,7 +70182,10 @@
     "model.layers.6.mlp.experts.99.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.6.mlp.experts.99.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.6.mlp.experts.99.up_proj.scales": "model-00001-of-00005.safetensors",
-    "model.layers.6.mlp.gate.weight": "model-00001-of-00005.safetensors",
     "model.layers.6.post_attention_layernorm.weight": "model-00001-of-00005.safetensors",
     "model.layers.6.self_attn.k_norm.weight": "model-00001-of-00005.safetensors",
     "model.layers.6.self_attn.k_proj.g_idx": "model-00001-of-00005.safetensors",
@@ -71607,7 +71742,10 @@
     "model.layers.7.mlp.experts.99.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.7.mlp.experts.99.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.7.mlp.experts.99.up_proj.scales": "model-00001-of-00005.safetensors",
-    "model.layers.7.mlp.gate.weight": "model-00001-of-00005.safetensors",
     "model.layers.7.post_attention_layernorm.weight": "model-00001-of-00005.safetensors",
     "model.layers.7.self_attn.k_norm.weight": "model-00001-of-00005.safetensors",
     "model.layers.7.self_attn.k_proj.g_idx": "model-00001-of-00005.safetensors",
@@ -73164,7 +73302,10 @@
     "model.layers.8.mlp.experts.99.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.8.mlp.experts.99.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.8.mlp.experts.99.up_proj.scales": "model-00001-of-00005.safetensors",
-    "model.layers.8.mlp.gate.weight": "model-00001-of-00005.safetensors",
     "model.layers.8.post_attention_layernorm.weight": "model-00001-of-00005.safetensors",
     "model.layers.8.self_attn.k_norm.weight": "model-00001-of-00005.safetensors",
     "model.layers.8.self_attn.k_proj.g_idx": "model-00001-of-00005.safetensors",
@@ -74721,7 +74862,10 @@
     "model.layers.9.mlp.experts.99.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.9.mlp.experts.99.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.9.mlp.experts.99.up_proj.scales": "model-00001-of-00005.safetensors",
-    "model.layers.9.mlp.gate.weight": "model-00001-of-00005.safetensors",
     "model.layers.9.post_attention_layernorm.weight": "model-00001-of-00005.safetensors",
     "model.layers.9.self_attn.k_norm.weight": "model-00001-of-00005.safetensors",
     "model.layers.9.self_attn.k_proj.g_idx": "model-00001-of-00005.safetensors",

 {
   "metadata": {
+    "total_size": 16905940992
   },
   "weight_map": {
     "lm_head.weight": "model-00005-of-00005.safetensors",
     "model.layers.0.mlp.experts.99.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.0.mlp.experts.99.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.0.mlp.experts.99.up_proj.scales": "model-00001-of-00005.safetensors",
+    "model.layers.0.mlp.gate.g_idx": "model-00001-of-00005.safetensors",
+    "model.layers.0.mlp.gate.qweight": "model-00001-of-00005.safetensors",
+    "model.layers.0.mlp.gate.qzeros": "model-00001-of-00005.safetensors",
+    "model.layers.0.mlp.gate.scales": "model-00001-of-00005.safetensors",
     "model.layers.0.post_attention_layernorm.weight": "model-00001-of-00005.safetensors",
     "model.layers.0.self_attn.k_norm.weight": "model-00001-of-00005.safetensors",
     "model.layers.0.self_attn.k_proj.g_idx": "model-00001-of-00005.safetensors",
     "model.layers.1.mlp.experts.99.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.1.mlp.experts.99.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.1.mlp.experts.99.up_proj.scales": "model-00001-of-00005.safetensors",
+    "model.layers.1.mlp.gate.g_idx": "model-00001-of-00005.safetensors",
+    "model.layers.1.mlp.gate.qweight": "model-00001-of-00005.safetensors",
+    "model.layers.1.mlp.gate.qzeros": "model-00001-of-00005.safetensors",
+    "model.layers.1.mlp.gate.scales": "model-00001-of-00005.safetensors",
     "model.layers.1.post_attention_layernorm.weight": "model-00001-of-00005.safetensors",
     "model.layers.1.self_attn.k_norm.weight": "model-00001-of-00005.safetensors",
     "model.layers.1.self_attn.k_proj.g_idx": "model-00001-of-00005.safetensors",
     "model.layers.10.mlp.experts.4.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.10.mlp.experts.4.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.10.mlp.experts.4.up_proj.scales": "model-00001-of-00005.safetensors",
+    "model.layers.10.mlp.experts.40.down_proj.g_idx": "model-00001-of-00005.safetensors",
+    "model.layers.10.mlp.experts.40.down_proj.qweight": "model-00001-of-00005.safetensors",
+    "model.layers.10.mlp.experts.40.down_proj.qzeros": "model-00001-of-00005.safetensors",
+    "model.layers.10.mlp.experts.40.down_proj.scales": "model-00001-of-00005.safetensors",
     "model.layers.10.mlp.experts.40.gate_proj.g_idx": "model-00001-of-00005.safetensors",
     "model.layers.10.mlp.experts.40.gate_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.10.mlp.experts.40.gate_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.10.mlp.experts.40.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.10.mlp.experts.40.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.10.mlp.experts.40.up_proj.scales": "model-00001-of-00005.safetensors",
+    "model.layers.10.mlp.experts.41.down_proj.g_idx": "model-00001-of-00005.safetensors",
+    "model.layers.10.mlp.experts.41.down_proj.qweight": "model-00001-of-00005.safetensors",
+    "model.layers.10.mlp.experts.41.down_proj.qzeros": "model-00001-of-00005.safetensors",
+    "model.layers.10.mlp.experts.41.down_proj.scales": "model-00001-of-00005.safetensors",
+    "model.layers.10.mlp.experts.41.gate_proj.g_idx": "model-00001-of-00005.safetensors",
+    "model.layers.10.mlp.experts.41.gate_proj.qweight": "model-00001-of-00005.safetensors",
+    "model.layers.10.mlp.experts.41.gate_proj.qzeros": "model-00001-of-00005.safetensors",
+    "model.layers.10.mlp.experts.41.gate_proj.scales": "model-00001-of-00005.safetensors",
+    "model.layers.10.mlp.experts.41.up_proj.g_idx": "model-00001-of-00005.safetensors",
+    "model.layers.10.mlp.experts.41.up_proj.qweight": "model-00001-of-00005.safetensors",
+    "model.layers.10.mlp.experts.41.up_proj.qzeros": "model-00001-of-00005.safetensors",
+    "model.layers.10.mlp.experts.41.up_proj.scales": "model-00001-of-00005.safetensors",
     "model.layers.10.mlp.experts.42.down_proj.g_idx": "model-00002-of-00005.safetensors",
     "model.layers.10.mlp.experts.42.down_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.10.mlp.experts.42.down_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.10.mlp.experts.42.down_proj.scales": "model-00002-of-00005.safetensors",
+    "model.layers.10.mlp.experts.42.gate_proj.g_idx": "model-00001-of-00005.safetensors",
+    "model.layers.10.mlp.experts.42.gate_proj.qweight": "model-00001-of-00005.safetensors",
+    "model.layers.10.mlp.experts.42.gate_proj.qzeros": "model-00001-of-00005.safetensors",
+    "model.layers.10.mlp.experts.42.gate_proj.scales": "model-00001-of-00005.safetensors",
     "model.layers.10.mlp.experts.42.up_proj.g_idx": "model-00002-of-00005.safetensors",
     "model.layers.10.mlp.experts.42.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.10.mlp.experts.42.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.10.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.10.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.10.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
+    "model.layers.10.mlp.gate.g_idx": "model-00001-of-00005.safetensors",
+    "model.layers.10.mlp.gate.qweight": "model-00001-of-00005.safetensors",
+    "model.layers.10.mlp.gate.qzeros": "model-00001-of-00005.safetensors",
+    "model.layers.10.mlp.gate.scales": "model-00001-of-00005.safetensors",
     "model.layers.10.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.10.self_attn.k_norm.weight": "model-00001-of-00005.safetensors",
     "model.layers.10.self_attn.k_proj.g_idx": "model-00001-of-00005.safetensors",
     "model.layers.11.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.11.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.11.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
+    "model.layers.11.mlp.gate.g_idx": "model-00002-of-00005.safetensors",
+    "model.layers.11.mlp.gate.qweight": "model-00002-of-00005.safetensors",
+    "model.layers.11.mlp.gate.qzeros": "model-00002-of-00005.safetensors",
+    "model.layers.11.mlp.gate.scales": "model-00002-of-00005.safetensors",
     "model.layers.11.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.11.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.11.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
     "model.layers.12.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.12.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.12.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
+    "model.layers.12.mlp.gate.g_idx": "model-00002-of-00005.safetensors",
+    "model.layers.12.mlp.gate.qweight": "model-00002-of-00005.safetensors",
+    "model.layers.12.mlp.gate.qzeros": "model-00002-of-00005.safetensors",
+    "model.layers.12.mlp.gate.scales": "model-00002-of-00005.safetensors",
     "model.layers.12.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.12.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.12.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
     "model.layers.13.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.13.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.13.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
+    "model.layers.13.mlp.gate.g_idx": "model-00002-of-00005.safetensors",
+    "model.layers.13.mlp.gate.qweight": "model-00002-of-00005.safetensors",
+    "model.layers.13.mlp.gate.qzeros": "model-00002-of-00005.safetensors",
+    "model.layers.13.mlp.gate.scales": "model-00002-of-00005.safetensors",
     "model.layers.13.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.13.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.13.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
     "model.layers.14.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.14.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.14.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
+    "model.layers.14.mlp.gate.g_idx": "model-00002-of-00005.safetensors",
+    "model.layers.14.mlp.gate.qweight": "model-00002-of-00005.safetensors",
+    "model.layers.14.mlp.gate.qzeros": "model-00002-of-00005.safetensors",
+    "model.layers.14.mlp.gate.scales": "model-00002-of-00005.safetensors",
     "model.layers.14.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.14.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.14.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
     "model.layers.15.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.15.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.15.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
+    "model.layers.15.mlp.gate.g_idx": "model-00002-of-00005.safetensors",
+    "model.layers.15.mlp.gate.qweight": "model-00002-of-00005.safetensors",
+    "model.layers.15.mlp.gate.qzeros": "model-00002-of-00005.safetensors",
+    "model.layers.15.mlp.gate.scales": "model-00002-of-00005.safetensors",
     "model.layers.15.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.15.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.15.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
     "model.layers.16.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.16.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.16.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
+    "model.layers.16.mlp.gate.g_idx": "model-00002-of-00005.safetensors",
+    "model.layers.16.mlp.gate.qweight": "model-00002-of-00005.safetensors",
+    "model.layers.16.mlp.gate.qzeros": "model-00002-of-00005.safetensors",
+    "model.layers.16.mlp.gate.scales": "model-00002-of-00005.safetensors",
     "model.layers.16.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.16.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.16.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
     "model.layers.17.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.17.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.17.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
+    "model.layers.17.mlp.gate.g_idx": "model-00002-of-00005.safetensors",
+    "model.layers.17.mlp.gate.qweight": "model-00002-of-00005.safetensors",
+    "model.layers.17.mlp.gate.qzeros": "model-00002-of-00005.safetensors",
+    "model.layers.17.mlp.gate.scales": "model-00002-of-00005.safetensors",
     "model.layers.17.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.17.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.17.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
     "model.layers.18.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.18.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.18.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
+    "model.layers.18.mlp.gate.g_idx": "model-00002-of-00005.safetensors",
+    "model.layers.18.mlp.gate.qweight": "model-00002-of-00005.safetensors",
+    "model.layers.18.mlp.gate.qzeros": "model-00002-of-00005.safetensors",
+    "model.layers.18.mlp.gate.scales": "model-00002-of-00005.safetensors",
     "model.layers.18.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.18.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.18.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
     "model.layers.19.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.19.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.19.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
+    "model.layers.19.mlp.gate.g_idx": "model-00002-of-00005.safetensors",
+    "model.layers.19.mlp.gate.qweight": "model-00002-of-00005.safetensors",
+    "model.layers.19.mlp.gate.qzeros": "model-00002-of-00005.safetensors",
+    "model.layers.19.mlp.gate.scales": "model-00002-of-00005.safetensors",
     "model.layers.19.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.19.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.19.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
     "model.layers.2.mlp.experts.99.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.2.mlp.experts.99.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.2.mlp.experts.99.up_proj.scales": "model-00001-of-00005.safetensors",
+    "model.layers.2.mlp.gate.g_idx": "model-00001-of-00005.safetensors",
+    "model.layers.2.mlp.gate.qweight": "model-00001-of-00005.safetensors",
+    "model.layers.2.mlp.gate.qzeros": "model-00001-of-00005.safetensors",
+    "model.layers.2.mlp.gate.scales": "model-00001-of-00005.safetensors",
     "model.layers.2.post_attention_layernorm.weight": "model-00001-of-00005.safetensors",
     "model.layers.2.self_attn.k_norm.weight": "model-00001-of-00005.safetensors",
     "model.layers.2.self_attn.k_proj.g_idx": "model-00001-of-00005.safetensors",
     "model.layers.20.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.20.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.20.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
+    "model.layers.20.mlp.gate.g_idx": "model-00002-of-00005.safetensors",
+    "model.layers.20.mlp.gate.qweight": "model-00002-of-00005.safetensors",
+    "model.layers.20.mlp.gate.qzeros": "model-00002-of-00005.safetensors",
+    "model.layers.20.mlp.gate.scales": "model-00002-of-00005.safetensors",
     "model.layers.20.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.20.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.20.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
     "model.layers.21.mlp.experts.99.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.21.mlp.experts.99.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.21.mlp.experts.99.up_proj.scales": "model-00002-of-00005.safetensors",
+    "model.layers.21.mlp.gate.g_idx": "model-00002-of-00005.safetensors",
+    "model.layers.21.mlp.gate.qweight": "model-00002-of-00005.safetensors",
+    "model.layers.21.mlp.gate.qzeros": "model-00002-of-00005.safetensors",
+    "model.layers.21.mlp.gate.scales": "model-00002-of-00005.safetensors",
     "model.layers.21.post_attention_layernorm.weight": "model-00002-of-00005.safetensors",
     "model.layers.21.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.21.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
     "model.layers.22.mlp.experts.72.up_proj.qweight": "model-00002-of-00005.safetensors",
     "model.layers.22.mlp.experts.72.up_proj.qzeros": "model-00002-of-00005.safetensors",
     "model.layers.22.mlp.experts.72.up_proj.scales": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.73.down_proj.g_idx": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.73.down_proj.qweight": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.73.down_proj.qzeros": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.73.down_proj.scales": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.73.gate_proj.g_idx": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.73.gate_proj.qweight": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.73.gate_proj.qzeros": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.73.gate_proj.scales": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.73.up_proj.g_idx": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.73.up_proj.qweight": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.73.up_proj.qzeros": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.73.up_proj.scales": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.74.down_proj.g_idx": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.74.down_proj.qweight": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.74.down_proj.qzeros": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.74.down_proj.scales": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.74.gate_proj.g_idx": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.74.gate_proj.qweight": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.74.gate_proj.qzeros": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.74.gate_proj.scales": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.74.up_proj.g_idx": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.74.up_proj.qweight": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.74.up_proj.qzeros": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.74.up_proj.scales": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.75.down_proj.g_idx": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.75.down_proj.qweight": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.75.down_proj.qzeros": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.75.down_proj.scales": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.75.gate_proj.g_idx": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.75.gate_proj.qweight": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.75.gate_proj.qzeros": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.75.gate_proj.scales": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.75.up_proj.g_idx": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.75.up_proj.qweight": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.75.up_proj.qzeros": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.75.up_proj.scales": "model-00002-of-00005.safetensors",
     "model.layers.22.mlp.experts.76.down_proj.g_idx": "model-00003-of-00005.safetensors",
     "model.layers.22.mlp.experts.76.down_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.22.mlp.experts.76.down_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.22.mlp.experts.76.down_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.22.mlp.experts.76.gate_proj.g_idx": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.76.gate_proj.qweight": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.76.gate_proj.qzeros": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.experts.76.gate_proj.scales": "model-00002-of-00005.safetensors",
     "model.layers.22.mlp.experts.76.up_proj.g_idx": "model-00003-of-00005.safetensors",
     "model.layers.22.mlp.experts.76.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.22.mlp.experts.76.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.22.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.22.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.22.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.22.mlp.gate.g_idx": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.gate.qweight": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.gate.qzeros": "model-00002-of-00005.safetensors",
+    "model.layers.22.mlp.gate.scales": "model-00002-of-00005.safetensors",
     "model.layers.22.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.22.self_attn.k_norm.weight": "model-00002-of-00005.safetensors",
     "model.layers.22.self_attn.k_proj.g_idx": "model-00002-of-00005.safetensors",
     "model.layers.23.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.23.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.23.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.23.mlp.gate.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.23.mlp.gate.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.23.mlp.gate.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.23.mlp.gate.scales": "model-00003-of-00005.safetensors",
     "model.layers.23.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.23.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.23.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
     "model.layers.24.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.24.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.24.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.24.mlp.gate.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.24.mlp.gate.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.24.mlp.gate.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.24.mlp.gate.scales": "model-00003-of-00005.safetensors",
     "model.layers.24.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.24.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.24.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
     "model.layers.25.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.25.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.25.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.25.mlp.gate.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.25.mlp.gate.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.25.mlp.gate.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.25.mlp.gate.scales": "model-00003-of-00005.safetensors",
     "model.layers.25.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.25.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.25.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
     "model.layers.26.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.26.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.26.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.26.mlp.gate.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.26.mlp.gate.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.26.mlp.gate.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.26.mlp.gate.scales": "model-00003-of-00005.safetensors",
     "model.layers.26.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.26.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.26.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
     "model.layers.27.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.27.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.27.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.27.mlp.gate.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.27.mlp.gate.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.27.mlp.gate.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.27.mlp.gate.scales": "model-00003-of-00005.safetensors",
     "model.layers.27.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.27.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.27.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
     "model.layers.28.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.28.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.28.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.28.mlp.gate.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.28.mlp.gate.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.28.mlp.gate.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.28.mlp.gate.scales": "model-00003-of-00005.safetensors",
     "model.layers.28.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.28.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.28.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
     "model.layers.29.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.29.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.29.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.29.mlp.gate.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.29.mlp.gate.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.29.mlp.gate.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.29.mlp.gate.scales": "model-00003-of-00005.safetensors",
     "model.layers.29.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.29.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.29.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
     "model.layers.3.mlp.experts.99.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.3.mlp.experts.99.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.3.mlp.experts.99.up_proj.scales": "model-00001-of-00005.safetensors",
+    "model.layers.3.mlp.gate.g_idx": "model-00001-of-00005.safetensors",
+    "model.layers.3.mlp.gate.qweight": "model-00001-of-00005.safetensors",
+    "model.layers.3.mlp.gate.qzeros": "model-00001-of-00005.safetensors",
+    "model.layers.3.mlp.gate.scales": "model-00001-of-00005.safetensors",
     "model.layers.3.post_attention_layernorm.weight": "model-00001-of-00005.safetensors",
     "model.layers.3.self_attn.k_norm.weight": "model-00001-of-00005.safetensors",
     "model.layers.3.self_attn.k_proj.g_idx": "model-00001-of-00005.safetensors",
     "model.layers.30.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.30.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.30.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.30.mlp.gate.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.30.mlp.gate.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.30.mlp.gate.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.30.mlp.gate.scales": "model-00003-of-00005.safetensors",
     "model.layers.30.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.30.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.30.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
     "model.layers.31.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.31.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.31.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.31.mlp.gate.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.31.mlp.gate.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.31.mlp.gate.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.31.mlp.gate.scales": "model-00003-of-00005.safetensors",
     "model.layers.31.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.31.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.31.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
     "model.layers.32.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.32.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.32.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.32.mlp.gate.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.32.mlp.gate.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.32.mlp.gate.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.32.mlp.gate.scales": "model-00003-of-00005.safetensors",
     "model.layers.32.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.32.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.32.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
     "model.layers.33.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.33.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.33.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.33.mlp.gate.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.33.mlp.gate.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.33.mlp.gate.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.33.mlp.gate.scales": "model-00003-of-00005.safetensors",
     "model.layers.33.post_attention_layernorm.weight": "model-00003-of-00005.safetensors",
     "model.layers.33.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.33.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.104.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.104.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.104.up_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.105.down_proj.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.105.down_proj.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.105.down_proj.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.105.down_proj.scales": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.105.gate_proj.g_idx": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.105.gate_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.105.gate_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.105.gate_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.105.up_proj.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.105.up_proj.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.105.up_proj.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.105.up_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.106.down_proj.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.106.down_proj.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.106.down_proj.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.106.down_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.106.gate_proj.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.106.gate_proj.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.106.gate_proj.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.106.gate_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.106.up_proj.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.106.up_proj.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.106.up_proj.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.106.up_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.107.down_proj.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.107.down_proj.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.107.down_proj.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.107.down_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.107.gate_proj.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.107.gate_proj.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.107.gate_proj.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.107.gate_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.107.up_proj.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.107.up_proj.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.107.up_proj.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.107.up_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.108.down_proj.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.108.down_proj.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.108.down_proj.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.108.down_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.108.gate_proj.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.108.gate_proj.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.108.gate_proj.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.108.gate_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.108.up_proj.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.108.up_proj.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.108.up_proj.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.108.up_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.109.down_proj.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.109.down_proj.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.109.down_proj.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.109.down_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.109.gate_proj.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.109.gate_proj.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.109.gate_proj.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.109.gate_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.109.up_proj.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.109.up_proj.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.109.up_proj.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.109.up_proj.scales": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.11.down_proj.g_idx": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.11.down_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.11.down_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.110.down_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.34.mlp.experts.110.down_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.34.mlp.experts.110.down_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.34.mlp.experts.110.gate_proj.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.110.gate_proj.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.110.gate_proj.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.experts.110.gate_proj.scales": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.110.up_proj.g_idx": "model-00004-of-00005.safetensors",
     "model.layers.34.mlp.experts.110.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.34.mlp.experts.110.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.34.mlp.experts.99.up_proj.qweight": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.99.up_proj.qzeros": "model-00003-of-00005.safetensors",
     "model.layers.34.mlp.experts.99.up_proj.scales": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.gate.g_idx": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.gate.qweight": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.gate.qzeros": "model-00003-of-00005.safetensors",
+    "model.layers.34.mlp.gate.scales": "model-00003-of-00005.safetensors",
     "model.layers.34.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.34.self_attn.k_norm.weight": "model-00003-of-00005.safetensors",
     "model.layers.34.self_attn.k_proj.g_idx": "model-00003-of-00005.safetensors",
     "model.layers.35.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.35.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.35.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.35.mlp.gate.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.35.mlp.gate.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.35.mlp.gate.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.35.mlp.gate.scales": "model-00004-of-00005.safetensors",
     "model.layers.35.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.35.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.35.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
     "model.layers.36.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.36.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.36.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.36.mlp.gate.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.36.mlp.gate.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.36.mlp.gate.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.36.mlp.gate.scales": "model-00004-of-00005.safetensors",
     "model.layers.36.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.36.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.36.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
     "model.layers.37.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.37.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.37.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.37.mlp.gate.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.37.mlp.gate.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.37.mlp.gate.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.37.mlp.gate.scales": "model-00004-of-00005.safetensors",
     "model.layers.37.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.37.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.37.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
     "model.layers.38.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.38.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.38.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.38.mlp.gate.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.38.mlp.gate.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.38.mlp.gate.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.38.mlp.gate.scales": "model-00004-of-00005.safetensors",
     "model.layers.38.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.38.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.38.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
     "model.layers.39.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.39.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.39.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.39.mlp.gate.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.39.mlp.gate.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.39.mlp.gate.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.39.mlp.gate.scales": "model-00004-of-00005.safetensors",
     "model.layers.39.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.39.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.39.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
     "model.layers.4.mlp.experts.99.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.4.mlp.experts.99.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.4.mlp.experts.99.up_proj.scales": "model-00001-of-00005.safetensors",
+    "model.layers.4.mlp.gate.g_idx": "model-00001-of-00005.safetensors",
+    "model.layers.4.mlp.gate.qweight": "model-00001-of-00005.safetensors",
+    "model.layers.4.mlp.gate.qzeros": "model-00001-of-00005.safetensors",
+    "model.layers.4.mlp.gate.scales": "model-00001-of-00005.safetensors",
     "model.layers.4.post_attention_layernorm.weight": "model-00001-of-00005.safetensors",
     "model.layers.4.self_attn.k_norm.weight": "model-00001-of-00005.safetensors",
     "model.layers.4.self_attn.k_proj.g_idx": "model-00001-of-00005.safetensors",
     "model.layers.40.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.40.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.40.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.40.mlp.gate.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.40.mlp.gate.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.40.mlp.gate.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.40.mlp.gate.scales": "model-00004-of-00005.safetensors",
     "model.layers.40.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.40.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.40.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
     "model.layers.41.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.41.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.41.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.41.mlp.gate.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.41.mlp.gate.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.41.mlp.gate.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.41.mlp.gate.scales": "model-00004-of-00005.safetensors",
     "model.layers.41.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.41.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.41.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
     "model.layers.42.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.42.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.42.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.42.mlp.gate.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.42.mlp.gate.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.42.mlp.gate.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.42.mlp.gate.scales": "model-00004-of-00005.safetensors",
     "model.layers.42.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.42.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.42.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
     "model.layers.43.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.43.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.43.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.43.mlp.gate.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.43.mlp.gate.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.43.mlp.gate.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.43.mlp.gate.scales": "model-00004-of-00005.safetensors",
     "model.layers.43.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.43.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.43.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
     "model.layers.44.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.44.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.44.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.44.mlp.gate.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.44.mlp.gate.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.44.mlp.gate.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.44.mlp.gate.scales": "model-00004-of-00005.safetensors",
     "model.layers.44.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.44.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.44.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
     "model.layers.45.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.45.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.45.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.45.mlp.gate.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.45.mlp.gate.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.45.mlp.gate.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.45.mlp.gate.scales": "model-00004-of-00005.safetensors",
     "model.layers.45.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.45.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.45.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
     "model.layers.46.mlp.experts.99.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.46.mlp.experts.99.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.46.mlp.experts.99.up_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.46.mlp.gate.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.46.mlp.gate.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.46.mlp.gate.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.46.mlp.gate.scales": "model-00004-of-00005.safetensors",
     "model.layers.46.post_attention_layernorm.weight": "model-00004-of-00005.safetensors",
     "model.layers.46.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.46.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
     "model.layers.47.mlp.experts.1.up_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.47.mlp.experts.1.up_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.47.mlp.experts.1.up_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.10.down_proj.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.10.down_proj.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.10.down_proj.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.10.down_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.10.gate_proj.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.10.gate_proj.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.10.gate_proj.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.10.gate_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.10.up_proj.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.10.up_proj.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.10.up_proj.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.10.up_proj.scales": "model-00004-of-00005.safetensors",
     "model.layers.47.mlp.experts.100.down_proj.g_idx": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.100.down_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.100.down_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.109.up_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.109.up_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.109.up_proj.scales": "model-00005-of-00005.safetensors",
+    "model.layers.47.mlp.experts.11.down_proj.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.11.down_proj.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.11.down_proj.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.11.down_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.11.gate_proj.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.11.gate_proj.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.11.gate_proj.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.11.gate_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.11.up_proj.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.11.up_proj.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.11.up_proj.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.11.up_proj.scales": "model-00004-of-00005.safetensors",
     "model.layers.47.mlp.experts.110.down_proj.g_idx": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.110.down_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.110.down_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.12.down_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.12.down_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.12.down_proj.scales": "model-00005-of-00005.safetensors",
+    "model.layers.47.mlp.experts.12.gate_proj.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.12.gate_proj.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.12.gate_proj.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.12.gate_proj.scales": "model-00004-of-00005.safetensors",
     "model.layers.47.mlp.experts.12.up_proj.g_idx": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.12.up_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.12.up_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.49.up_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.49.up_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.49.up_proj.scales": "model-00005-of-00005.safetensors",
+    "model.layers.47.mlp.experts.5.down_proj.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.5.down_proj.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.5.down_proj.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.5.down_proj.scales": "model-00004-of-00005.safetensors",
     "model.layers.47.mlp.experts.5.gate_proj.g_idx": "model-00004-of-00005.safetensors",
     "model.layers.47.mlp.experts.5.gate_proj.qweight": "model-00004-of-00005.safetensors",
     "model.layers.47.mlp.experts.5.gate_proj.qzeros": "model-00004-of-00005.safetensors",
     "model.layers.47.mlp.experts.5.gate_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.5.up_proj.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.5.up_proj.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.5.up_proj.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.5.up_proj.scales": "model-00004-of-00005.safetensors",
     "model.layers.47.mlp.experts.50.down_proj.g_idx": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.50.down_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.50.down_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.59.up_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.59.up_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.59.up_proj.scales": "model-00005-of-00005.safetensors",
+    "model.layers.47.mlp.experts.6.down_proj.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.6.down_proj.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.6.down_proj.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.6.down_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.6.gate_proj.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.6.gate_proj.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.6.gate_proj.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.6.gate_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.6.up_proj.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.6.up_proj.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.6.up_proj.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.6.up_proj.scales": "model-00004-of-00005.safetensors",
     "model.layers.47.mlp.experts.60.down_proj.g_idx": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.60.down_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.60.down_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.69.up_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.69.up_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.69.up_proj.scales": "model-00005-of-00005.safetensors",
+    "model.layers.47.mlp.experts.7.down_proj.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.7.down_proj.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.7.down_proj.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.7.down_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.7.gate_proj.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.7.gate_proj.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.7.gate_proj.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.7.gate_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.7.up_proj.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.7.up_proj.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.7.up_proj.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.7.up_proj.scales": "model-00004-of-00005.safetensors",
     "model.layers.47.mlp.experts.70.down_proj.g_idx": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.70.down_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.70.down_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.79.up_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.79.up_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.79.up_proj.scales": "model-00005-of-00005.safetensors",
+    "model.layers.47.mlp.experts.8.down_proj.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.8.down_proj.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.8.down_proj.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.8.down_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.8.gate_proj.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.8.gate_proj.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.8.gate_proj.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.8.gate_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.8.up_proj.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.8.up_proj.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.8.up_proj.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.8.up_proj.scales": "model-00004-of-00005.safetensors",
     "model.layers.47.mlp.experts.80.down_proj.g_idx": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.80.down_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.80.down_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.89.up_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.89.up_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.89.up_proj.scales": "model-00005-of-00005.safetensors",
+    "model.layers.47.mlp.experts.9.down_proj.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.9.down_proj.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.9.down_proj.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.9.down_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.9.gate_proj.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.9.gate_proj.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.9.gate_proj.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.9.gate_proj.scales": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.9.up_proj.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.9.up_proj.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.9.up_proj.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.experts.9.up_proj.scales": "model-00004-of-00005.safetensors",
     "model.layers.47.mlp.experts.90.down_proj.g_idx": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.90.down_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.90.down_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.99.up_proj.qweight": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.99.up_proj.qzeros": "model-00005-of-00005.safetensors",
     "model.layers.47.mlp.experts.99.up_proj.scales": "model-00005-of-00005.safetensors",
+    "model.layers.47.mlp.gate.g_idx": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.gate.qweight": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.gate.qzeros": "model-00004-of-00005.safetensors",
+    "model.layers.47.mlp.gate.scales": "model-00004-of-00005.safetensors",
     "model.layers.47.post_attention_layernorm.weight": "model-00005-of-00005.safetensors",
     "model.layers.47.self_attn.k_norm.weight": "model-00004-of-00005.safetensors",
     "model.layers.47.self_attn.k_proj.g_idx": "model-00004-of-00005.safetensors",
     "model.layers.5.mlp.experts.99.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.5.mlp.experts.99.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.5.mlp.experts.99.up_proj.scales": "model-00001-of-00005.safetensors",
+    "model.layers.5.mlp.gate.g_idx": "model-00001-of-00005.safetensors",
+    "model.layers.5.mlp.gate.qweight": "model-00001-of-00005.safetensors",
+    "model.layers.5.mlp.gate.qzeros": "model-00001-of-00005.safetensors",
+    "model.layers.5.mlp.gate.scales": "model-00001-of-00005.safetensors",
     "model.layers.5.post_attention_layernorm.weight": "model-00001-of-00005.safetensors",
     "model.layers.5.self_attn.k_norm.weight": "model-00001-of-00005.safetensors",
     "model.layers.5.self_attn.k_proj.g_idx": "model-00001-of-00005.safetensors",
     "model.layers.6.mlp.experts.99.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.6.mlp.experts.99.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.6.mlp.experts.99.up_proj.scales": "model-00001-of-00005.safetensors",
+    "model.layers.6.mlp.gate.g_idx": "model-00001-of-00005.safetensors",
+    "model.layers.6.mlp.gate.qweight": "model-00001-of-00005.safetensors",
+    "model.layers.6.mlp.gate.qzeros": "model-00001-of-00005.safetensors",
+    "model.layers.6.mlp.gate.scales": "model-00001-of-00005.safetensors",
     "model.layers.6.post_attention_layernorm.weight": "model-00001-of-00005.safetensors",
     "model.layers.6.self_attn.k_norm.weight": "model-00001-of-00005.safetensors",
     "model.layers.6.self_attn.k_proj.g_idx": "model-00001-of-00005.safetensors",
     "model.layers.7.mlp.experts.99.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.7.mlp.experts.99.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.7.mlp.experts.99.up_proj.scales": "model-00001-of-00005.safetensors",
+    "model.layers.7.mlp.gate.g_idx": "model-00001-of-00005.safetensors",
+    "model.layers.7.mlp.gate.qweight": "model-00001-of-00005.safetensors",
+    "model.layers.7.mlp.gate.qzeros": "model-00001-of-00005.safetensors",
+    "model.layers.7.mlp.gate.scales": "model-00001-of-00005.safetensors",
     "model.layers.7.post_attention_layernorm.weight": "model-00001-of-00005.safetensors",
     "model.layers.7.self_attn.k_norm.weight": "model-00001-of-00005.safetensors",
     "model.layers.7.self_attn.k_proj.g_idx": "model-00001-of-00005.safetensors",
     "model.layers.8.mlp.experts.99.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.8.mlp.experts.99.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.8.mlp.experts.99.up_proj.scales": "model-00001-of-00005.safetensors",
+    "model.layers.8.mlp.gate.g_idx": "model-00001-of-00005.safetensors",
+    "model.layers.8.mlp.gate.qweight": "model-00001-of-00005.safetensors",
+    "model.layers.8.mlp.gate.qzeros": "model-00001-of-00005.safetensors",
+    "model.layers.8.mlp.gate.scales": "model-00001-of-00005.safetensors",
     "model.layers.8.post_attention_layernorm.weight": "model-00001-of-00005.safetensors",
     "model.layers.8.self_attn.k_norm.weight": "model-00001-of-00005.safetensors",
     "model.layers.8.self_attn.k_proj.g_idx": "model-00001-of-00005.safetensors",
     "model.layers.9.mlp.experts.99.up_proj.qweight": "model-00001-of-00005.safetensors",
     "model.layers.9.mlp.experts.99.up_proj.qzeros": "model-00001-of-00005.safetensors",
     "model.layers.9.mlp.experts.99.up_proj.scales": "model-00001-of-00005.safetensors",
+    "model.layers.9.mlp.gate.g_idx": "model-00001-of-00005.safetensors",
+    "model.layers.9.mlp.gate.qweight": "model-00001-of-00005.safetensors",
+    "model.layers.9.mlp.gate.qzeros": "model-00001-of-00005.safetensors",
+    "model.layers.9.mlp.gate.scales": "model-00001-of-00005.safetensors",
     "model.layers.9.post_attention_layernorm.weight": "model-00001-of-00005.safetensors",
     "model.layers.9.self_attn.k_norm.weight": "model-00001-of-00005.safetensors",
     "model.layers.9.self_attn.k_proj.g_idx": "model-00001-of-00005.safetensors",

quantize_config.json CHANGED Viewed

@@ -9,13 +9,15 @@
   "pack_dtype": "int32",
   "meta": {
     "quantizer": [
-      "gptqmodel:2.2.0"
     ],
     "uri": "https://github.com/modelcloud/gptqmodel",
-    "damp_percent": 0.01,
-    "damp_auto_increment": 0.0025,
     "static_groups": false,
     "true_sequential": true,
-    "mse": 0.0
   }
 }

   "pack_dtype": "int32",
   "meta": {
     "quantizer": [
+      "gptqmodel:4.0.0-dev"
     ],
     "uri": "https://github.com/modelcloud/gptqmodel",
+    "damp_percent": 0.05,
+    "damp_auto_increment": 0.01,
     "static_groups": false,
     "true_sequential": true,
+    "mse": 0.0,
+    "v2": false,
+    "v2_alpha": 0.25
   }
 }