jjzha commited on Nov 19, 2024

Commit

6fa81bc

verified ·

1 Parent(s): 9959046

Delete models--NLPnorth--snakmodel-7b-base

Browse files

Files changed (22) hide show

models--NLPnorth--snakmodel-7b-base/blobs/04a6b76c7b984884db39812a5ab72a8adc931a89 +0 -44
models--NLPnorth--snakmodel-7b-base/blobs/13674e51e613232b3becd7046ec62b76392c976e +0 -298
models--NLPnorth--snakmodel-7b-base/blobs/1e59223bfb9c3e9c479515876e9e5d164924ecaa +0 -30
models--NLPnorth--snakmodel-7b-base/blobs/1f293b23113f1f3a34183cf34fd0be781156fb20 +0 -29
models--NLPnorth--snakmodel-7b-base/blobs/48482c1623390e7ba8be812c489d663cc138d0b1 +0 -7
models--NLPnorth--snakmodel-7b-base/blobs/4c8988d40c2efb718744eefa7d4d915e17b40df7 +0 -88
models--NLPnorth--snakmodel-7b-base/blobs/589fbcab306e58ba6d65e7dde03c89eb03ab6595 +0 -6
models--NLPnorth--snakmodel-7b-base/blobs/814e1426a83b0eed37b690ab766e7535403e53bf +0 -0
models--NLPnorth--snakmodel-7b-base/blobs/86fe1a5aa6953e93b0b2020609b0a52c11621259 +0 -0
models--NLPnorth--snakmodel-7b-base/blobs/9e556afd44213b6bd1be2b850ebbbd98f5481437a8021afaf58ee7fb1818d347 +0 -0
models--NLPnorth--snakmodel-7b-base/blobs/a6344aac8c09253b3b630fb776ae94478aa0275b +0 -35
models--NLPnorth--snakmodel-7b-base/refs/main +0 -1
models--NLPnorth--snakmodel-7b-base/snapshots/a8035fc09140828488a858d9b56c8dc3b14288a6/.gitattributes +0 -35
models--NLPnorth--snakmodel-7b-base/snapshots/a8035fc09140828488a858d9b56c8dc3b14288a6/README.md +0 -88
models--NLPnorth--snakmodel-7b-base/snapshots/a8035fc09140828488a858d9b56c8dc3b14288a6/config.json +0 -29
models--NLPnorth--snakmodel-7b-base/snapshots/a8035fc09140828488a858d9b56c8dc3b14288a6/generation_config.json +0 -6
models--NLPnorth--snakmodel-7b-base/snapshots/a8035fc09140828488a858d9b56c8dc3b14288a6/model.safetensors.index.json +0 -298
models--NLPnorth--snakmodel-7b-base/snapshots/a8035fc09140828488a858d9b56c8dc3b14288a6/snakmodel-base.png +0 -0
models--NLPnorth--snakmodel-7b-base/snapshots/a8035fc09140828488a858d9b56c8dc3b14288a6/special_tokens_map.json +0 -30
models--NLPnorth--snakmodel-7b-base/snapshots/a8035fc09140828488a858d9b56c8dc3b14288a6/tokenizer.json +0 -0
models--NLPnorth--snakmodel-7b-base/snapshots/a8035fc09140828488a858d9b56c8dc3b14288a6/tokenizer.model +0 -3
models--NLPnorth--snakmodel-7b-base/snapshots/a8035fc09140828488a858d9b56c8dc3b14288a6/tokenizer_config.json +0 -44

models--NLPnorth--snakmodel-7b-base/blobs/04a6b76c7b984884db39812a5ab72a8adc931a89 DELETED Viewed

@@ -1,44 +0,0 @@
-{
-  "add_bos_token": true,
-  "add_eos_token": false,
-  "added_tokens_decoder": {
-    "0": {
-      "content": "<unk>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "1": {
-      "content": "<s>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "2": {
-      "content": "</s>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    }
-  },
-  "bos_token": "<s>",
-  "clean_up_tokenization_spaces": false,
-  "cls_token": "<CLS>",
-  "eos_token": "</s>",
-  "legacy": false,
-  "mask_token": "<MASK>",
-  "model_max_length": 4096,
-  "pad_token": "</s>",
-  "padding_side": "left",
-  "sep_token": "<SEP>",
-  "sp_model_kwargs": {},
-  "tokenizer_class": "LlamaTokenizer",
-  "unk_token": "<unk>",
-  "use_default_system_prompt": false
-}

models--NLPnorth--snakmodel-7b-base/blobs/13674e51e613232b3becd7046ec62b76392c976e DELETED Viewed

@@ -1,298 +0,0 @@
-{
-  "metadata": {
-    "total_size": 13476831232
-  },
-  "weight_map": {
-    "lm_head.weight": "model-00003-of-00003.safetensors",
-    "model.embed_tokens.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.11.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.11.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.11.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.11.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.11.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.11.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.11.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.11.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.11.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.12.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.2.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.20.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.22.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.22.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.22.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.22.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.22.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.22.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.22.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.22.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.22.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.23.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.23.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.23.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.23.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.23.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.23.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.23.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.23.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.23.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.24.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.3.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.30.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.4.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.norm.weight": "model-00003-of-00003.safetensors"
-  }
-}

models--NLPnorth--snakmodel-7b-base/blobs/1e59223bfb9c3e9c479515876e9e5d164924ecaa DELETED Viewed

@@ -1,30 +0,0 @@
-{
-  "bos_token": {
-    "content": "<s>",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "eos_token": {
-    "content": "</s>",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "unk_token": {
-    "content": "<unk>",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "pad_token": {
-    "content": "</s>",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  }
-}

models--NLPnorth--snakmodel-7b-base/blobs/1f293b23113f1f3a34183cf34fd0be781156fb20 DELETED Viewed

@@ -1,29 +0,0 @@
-{
-  "_name_or_path": "NLPnorth/snakmodel-7b-base",
-  "architectures": [
-    "LlamaForCausalLM"
-  ],
-  "attention_bias": false,
-  "attention_dropout": 0.0,
-  "bos_token_id": 1,
-  "eos_token_id": 2,
-  "hidden_act": "silu",
-  "hidden_size": 4096,
-  "initializer_range": 0.02,
-  "intermediate_size": 11008,
-  "max_position_embeddings": 4096,
-  "mlp_bias": false,
-  "model_type": "llama",
-  "num_attention_heads": 32,
-  "num_hidden_layers": 32,
-  "num_key_value_heads": 32,
-  "pretraining_tp": 1,
-  "rms_norm_eps": 1e-05,
-  "rope_scaling": null,
-  "rope_theta": 10000.0,
-  "tie_word_embeddings": false,
-  "torch_dtype": "bfloat16",
-  "transformers_version": "4.40.2",
-  "use_cache": true,
-  "vocab_size": 32000
-}

models--NLPnorth--snakmodel-7b-base/blobs/48482c1623390e7ba8be812c489d663cc138d0b1 DELETED Viewed

@@ -1,7 +0,0 @@
-{
-  "<CLS>": 32000,
-  "<EOD>": 32002,
-  "<MASK>": 32003,
-  "<PAD>": 32004,
-  "<SEP>": 32001
-}

models--NLPnorth--snakmodel-7b-base/blobs/4c8988d40c2efb718744eefa7d4d915e17b40df7 DELETED Viewed

@@ -1,88 +0,0 @@
----
-language:
-- da
-license: llama2
-library_name: transformers
-base_model:
-- meta-llama/Llama-2-7b-hf
-pipeline_tag: text-generation
----
-![SnakModel Base Logo](snakmodel-base.png)
-## Model Details
-**SnakModel** is a 7B-parameter model specifically designed for the Danish language. This is the base variant: `SnakModel-7B (base)`. Our models build upon [Llama 2](https://huggingface.co/meta-llama/Llama-2-7b-hf), which we continuously pre-train on a diverse collection of Danish corpora comprising 350M documents and 13.6B words, before tuning it on 3.7M Danish instruction-answer pairs.
-**Model Developers**
-[NLPnorth research unit](https://nlpnorth.github.io) at the [IT University of Copenhagen](https://itu.dk), Denmark.
-**Variations**
-SnakModel comes as an instruction-tuned, and a base version. In addition, each model includes intermediate checkpoints (under model revisions).
-**Input**
-Text only.
-**Output**
-Text only.
-**Model Architecture**
-SnakModel is an auto-regressive, transformer-based language model. The `instruct` version uses supervised fine-tuning (SFT) to enable instruction following in Danish.
-**Model Dates**
-SnakModel was trained between January 2024 and September 2024.
-**License**
-This model follows the original [Llama 2 license agreement](https://huggingface.co/meta-llama/Llama-2-7b-hf/blob/main/LICENSE.txt).
-**Research Paper**
-[Released in Q1 2025]
-## Intended Use & Limitations
-**Intended Use Cases**
-SnakModel is intended for use in Danish. The instruction-tuned variant is intended for assistant-like chat.
-The `instruct` variant follows the Llama 2 (chat) instruction template, in which instructions are encapsulated in special tokens, i.e., `[INST] {instruction} [/INST]`.
-**Limitations**
-SnakModel variants are fine-tuned on Danish data. As such, the use in other languages falls out-of-scope. While we found SnakModel to be more proficient in Danish, than other Llama 2-based models, it still frequently generates factually incorrect output. Make sure to carefully evaluate and weigh these factors before deploying the model. In addition, make sure to adhere to the original [Llama 2 license agreement](https://huggingface.co/meta-llama/Llama-2-7b-hf/blob/main/LICENSE.txt).
-## Hardware and Software
-**Training Factors**
-SnakModel is trained on private infrastructure with one node, containing four NVIDIA A100-PCIe 40GB GPUs. The node has an AMD Epyc 7662 128 Core Processor and 1TB of RAM.
-**Carbon Footprint**
-Total training time accounted to 8,928 GPU hours, with an average carbon efficiency at 0.122kg CO2eq / kWh. This is equivalent to 272.3kg CO2eq emitted, based on the [Machine Learning Impact calculator](https://mlco2.github.io/impact).
-## Training Data
-**Overview**
-SnakModel was continuously pre-train on a diverse collection of Danish corpora comprising 350M documents and 13.6B words. The `instruct` version is further tuned on 3.7M Danish instruction-answer pairs.
-[Details to follow in Q1 2025]
-**Data Freshness**
-The pre-training data has a cutoff of January 2024.
-## Evaluation Results
-[Released in Q1 2025]
-## Citation
-[Released in Q1 2025]

models--NLPnorth--snakmodel-7b-base/blobs/589fbcab306e58ba6d65e7dde03c89eb03ab6595 DELETED Viewed

@@ -1,6 +0,0 @@
-{
-  "_from_model_config": true,
-  "bos_token_id": 1,
-  "eos_token_id": 2,
-  "transformers_version": "4.40.2"
-}

models--NLPnorth--snakmodel-7b-base/blobs/814e1426a83b0eed37b690ab766e7535403e53bf DELETED Viewed

Binary file (44.3 kB)

models--NLPnorth--snakmodel-7b-base/blobs/86fe1a5aa6953e93b0b2020609b0a52c11621259 DELETED Viewed

The diff for this file is too large to render. See raw diff

models--NLPnorth--snakmodel-7b-base/blobs/9e556afd44213b6bd1be2b850ebbbd98f5481437a8021afaf58ee7fb1818d347 DELETED Viewed

Binary file (500 kB)

models--NLPnorth--snakmodel-7b-base/blobs/a6344aac8c09253b3b630fb776ae94478aa0275b DELETED Viewed

@@ -1,35 +0,0 @@
-*.7z filter=lfs diff=lfs merge=lfs -text
-*.arrow filter=lfs diff=lfs merge=lfs -text
-*.bin filter=lfs diff=lfs merge=lfs -text
-*.bz2 filter=lfs diff=lfs merge=lfs -text
-*.ckpt filter=lfs diff=lfs merge=lfs -text
-*.ftz filter=lfs diff=lfs merge=lfs -text
-*.gz filter=lfs diff=lfs merge=lfs -text
-*.h5 filter=lfs diff=lfs merge=lfs -text
-*.joblib filter=lfs diff=lfs merge=lfs -text
-*.lfs.* filter=lfs diff=lfs merge=lfs -text
-*.mlmodel filter=lfs diff=lfs merge=lfs -text
-*.model filter=lfs diff=lfs merge=lfs -text
-*.msgpack filter=lfs diff=lfs merge=lfs -text
-*.npy filter=lfs diff=lfs merge=lfs -text
-*.npz filter=lfs diff=lfs merge=lfs -text
-*.onnx filter=lfs diff=lfs merge=lfs -text
-*.ot filter=lfs diff=lfs merge=lfs -text
-*.parquet filter=lfs diff=lfs merge=lfs -text
-*.pb filter=lfs diff=lfs merge=lfs -text
-*.pickle filter=lfs diff=lfs merge=lfs -text
-*.pkl filter=lfs diff=lfs merge=lfs -text
-*.pt filter=lfs diff=lfs merge=lfs -text
-*.pth filter=lfs diff=lfs merge=lfs -text
-*.rar filter=lfs diff=lfs merge=lfs -text
-*.safetensors filter=lfs diff=lfs merge=lfs -text
-saved_model/**/* filter=lfs diff=lfs merge=lfs -text
-*.tar.* filter=lfs diff=lfs merge=lfs -text
-*.tar filter=lfs diff=lfs merge=lfs -text
-*.tflite filter=lfs diff=lfs merge=lfs -text
-*.tgz filter=lfs diff=lfs merge=lfs -text
-*.wasm filter=lfs diff=lfs merge=lfs -text
-*.xz filter=lfs diff=lfs merge=lfs -text
-*.zip filter=lfs diff=lfs merge=lfs -text
-*.zst filter=lfs diff=lfs merge=lfs -text
-*tfevents* filter=lfs diff=lfs merge=lfs -text

models--NLPnorth--snakmodel-7b-base/refs/main DELETED Viewed

	@@ -1 +0,0 @@
1	- a8035fc09140828488a858d9b56c8dc3b14288a6

models--NLPnorth--snakmodel-7b-base/snapshots/a8035fc09140828488a858d9b56c8dc3b14288a6/.gitattributes DELETED Viewed

@@ -1,35 +0,0 @@
-*.7z filter=lfs diff=lfs merge=lfs -text
-*.arrow filter=lfs diff=lfs merge=lfs -text
-*.bin filter=lfs diff=lfs merge=lfs -text
-*.bz2 filter=lfs diff=lfs merge=lfs -text
-*.ckpt filter=lfs diff=lfs merge=lfs -text
-*.ftz filter=lfs diff=lfs merge=lfs -text
-*.gz filter=lfs diff=lfs merge=lfs -text
-*.h5 filter=lfs diff=lfs merge=lfs -text
-*.joblib filter=lfs diff=lfs merge=lfs -text
-*.lfs.* filter=lfs diff=lfs merge=lfs -text
-*.mlmodel filter=lfs diff=lfs merge=lfs -text
-*.model filter=lfs diff=lfs merge=lfs -text
-*.msgpack filter=lfs diff=lfs merge=lfs -text
-*.npy filter=lfs diff=lfs merge=lfs -text
-*.npz filter=lfs diff=lfs merge=lfs -text
-*.onnx filter=lfs diff=lfs merge=lfs -text
-*.ot filter=lfs diff=lfs merge=lfs -text
-*.parquet filter=lfs diff=lfs merge=lfs -text
-*.pb filter=lfs diff=lfs merge=lfs -text
-*.pickle filter=lfs diff=lfs merge=lfs -text
-*.pkl filter=lfs diff=lfs merge=lfs -text
-*.pt filter=lfs diff=lfs merge=lfs -text
-*.pth filter=lfs diff=lfs merge=lfs -text
-*.rar filter=lfs diff=lfs merge=lfs -text
-*.safetensors filter=lfs diff=lfs merge=lfs -text
-saved_model/**/* filter=lfs diff=lfs merge=lfs -text
-*.tar.* filter=lfs diff=lfs merge=lfs -text
-*.tar filter=lfs diff=lfs merge=lfs -text
-*.tflite filter=lfs diff=lfs merge=lfs -text
-*.tgz filter=lfs diff=lfs merge=lfs -text
-*.wasm filter=lfs diff=lfs merge=lfs -text
-*.xz filter=lfs diff=lfs merge=lfs -text
-*.zip filter=lfs diff=lfs merge=lfs -text
-*.zst filter=lfs diff=lfs merge=lfs -text
-*tfevents* filter=lfs diff=lfs merge=lfs -text

models--NLPnorth--snakmodel-7b-base/snapshots/a8035fc09140828488a858d9b56c8dc3b14288a6/README.md DELETED Viewed

@@ -1,88 +0,0 @@
----
-language:
-- da
-license: llama2
-library_name: transformers
-base_model:
-- meta-llama/Llama-2-7b-hf
-pipeline_tag: text-generation
----
-![SnakModel Base Logo](snakmodel-base.png)
-## Model Details
-**SnakModel** is a 7B-parameter model specifically designed for the Danish language. This is the base variant: `SnakModel-7B (base)`. Our models build upon [Llama 2](https://huggingface.co/meta-llama/Llama-2-7b-hf), which we continuously pre-train on a diverse collection of Danish corpora comprising 350M documents and 13.6B words, before tuning it on 3.7M Danish instruction-answer pairs.
-**Model Developers**
-[NLPnorth research unit](https://nlpnorth.github.io) at the [IT University of Copenhagen](https://itu.dk), Denmark.
-**Variations**
-SnakModel comes as an instruction-tuned, and a base version. In addition, each model includes intermediate checkpoints (under model revisions).
-**Input**
-Text only.
-**Output**
-Text only.
-**Model Architecture**
-SnakModel is an auto-regressive, transformer-based language model. The `instruct` version uses supervised fine-tuning (SFT) to enable instruction following in Danish.
-**Model Dates**
-SnakModel was trained between January 2024 and September 2024.
-**License**
-This model follows the original [Llama 2 license agreement](https://huggingface.co/meta-llama/Llama-2-7b-hf/blob/main/LICENSE.txt).
-**Research Paper**
-[Released in Q1 2025]
-## Intended Use & Limitations
-**Intended Use Cases**
-SnakModel is intended for use in Danish. The instruction-tuned variant is intended for assistant-like chat.
-The `instruct` variant follows the Llama 2 (chat) instruction template, in which instructions are encapsulated in special tokens, i.e., `[INST] {instruction} [/INST]`.
-**Limitations**
-SnakModel variants are fine-tuned on Danish data. As such, the use in other languages falls out-of-scope. While we found SnakModel to be more proficient in Danish, than other Llama 2-based models, it still frequently generates factually incorrect output. Make sure to carefully evaluate and weigh these factors before deploying the model. In addition, make sure to adhere to the original [Llama 2 license agreement](https://huggingface.co/meta-llama/Llama-2-7b-hf/blob/main/LICENSE.txt).
-## Hardware and Software
-**Training Factors**
-SnakModel is trained on private infrastructure with one node, containing four NVIDIA A100-PCIe 40GB GPUs. The node has an AMD Epyc 7662 128 Core Processor and 1TB of RAM.
-**Carbon Footprint**
-Total training time accounted to 8,928 GPU hours, with an average carbon efficiency at 0.122kg CO2eq / kWh. This is equivalent to 272.3kg CO2eq emitted, based on the [Machine Learning Impact calculator](https://mlco2.github.io/impact).
-## Training Data
-**Overview**
-SnakModel was continuously pre-train on a diverse collection of Danish corpora comprising 350M documents and 13.6B words. The `instruct` version is further tuned on 3.7M Danish instruction-answer pairs.
-[Details to follow in Q1 2025]
-**Data Freshness**
-The pre-training data has a cutoff of January 2024.
-## Evaluation Results
-[Released in Q1 2025]
-## Citation
-[Released in Q1 2025]

models--NLPnorth--snakmodel-7b-base/snapshots/a8035fc09140828488a858d9b56c8dc3b14288a6/config.json DELETED Viewed

@@ -1,29 +0,0 @@
-{
-  "_name_or_path": "NLPnorth/snakmodel-7b-base",
-  "architectures": [
-    "LlamaForCausalLM"
-  ],
-  "attention_bias": false,
-  "attention_dropout": 0.0,
-  "bos_token_id": 1,
-  "eos_token_id": 2,
-  "hidden_act": "silu",
-  "hidden_size": 4096,
-  "initializer_range": 0.02,
-  "intermediate_size": 11008,
-  "max_position_embeddings": 4096,
-  "mlp_bias": false,
-  "model_type": "llama",
-  "num_attention_heads": 32,
-  "num_hidden_layers": 32,
-  "num_key_value_heads": 32,
-  "pretraining_tp": 1,
-  "rms_norm_eps": 1e-05,
-  "rope_scaling": null,
-  "rope_theta": 10000.0,
-  "tie_word_embeddings": false,
-  "torch_dtype": "bfloat16",
-  "transformers_version": "4.40.2",
-  "use_cache": true,
-  "vocab_size": 32000
-}

models--NLPnorth--snakmodel-7b-base/snapshots/a8035fc09140828488a858d9b56c8dc3b14288a6/generation_config.json DELETED Viewed

@@ -1,6 +0,0 @@
-{
-  "_from_model_config": true,
-  "bos_token_id": 1,
-  "eos_token_id": 2,
-  "transformers_version": "4.40.2"
-}

models--NLPnorth--snakmodel-7b-base/snapshots/a8035fc09140828488a858d9b56c8dc3b14288a6/model.safetensors.index.json DELETED Viewed

@@ -1,298 +0,0 @@
-{
-  "metadata": {
-    "total_size": 13476831232
-  },
-  "weight_map": {
-    "lm_head.weight": "model-00003-of-00003.safetensors",
-    "model.embed_tokens.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.0.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.1.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.10.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.11.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.11.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.11.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.11.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.11.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.11.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.11.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.11.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.11.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.12.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.12.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.13.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.14.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.15.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.16.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.17.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.18.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.19.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.2.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.2.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.20.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.20.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.21.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.22.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.22.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.22.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.22.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.22.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "model.layers.22.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.22.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.22.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.22.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.23.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.23.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.23.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.23.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.23.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.23.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.23.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.23.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.23.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "model.layers.24.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.24.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.25.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.26.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.27.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.28.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.29.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.3.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.3.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.30.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.30.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.31.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "model.layers.4.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.4.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.5.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.6.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.7.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.8.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "model.layers.9.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "model.norm.weight": "model-00003-of-00003.safetensors"
-  }
-}

models--NLPnorth--snakmodel-7b-base/snapshots/a8035fc09140828488a858d9b56c8dc3b14288a6/snakmodel-base.png DELETED Viewed

Binary file (44.3 kB)

models--NLPnorth--snakmodel-7b-base/snapshots/a8035fc09140828488a858d9b56c8dc3b14288a6/special_tokens_map.json DELETED Viewed

@@ -1,30 +0,0 @@
-{
-  "bos_token": {
-    "content": "<s>",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "eos_token": {
-    "content": "</s>",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "unk_token": {
-    "content": "<unk>",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
-  "pad_token": {
-    "content": "</s>",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  }
-}

models--NLPnorth--snakmodel-7b-base/snapshots/a8035fc09140828488a858d9b56c8dc3b14288a6/tokenizer.json DELETED Viewed

The diff for this file is too large to render. See raw diff

models--NLPnorth--snakmodel-7b-base/snapshots/a8035fc09140828488a858d9b56c8dc3b14288a6/tokenizer.model DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:9e556afd44213b6bd1be2b850ebbbd98f5481437a8021afaf58ee7fb1818d347
-size 499723

models--NLPnorth--snakmodel-7b-base/snapshots/a8035fc09140828488a858d9b56c8dc3b14288a6/tokenizer_config.json DELETED Viewed

@@ -1,44 +0,0 @@
-{
-  "add_bos_token": true,
-  "add_eos_token": false,
-  "added_tokens_decoder": {
-    "0": {
-      "content": "<unk>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "1": {
-      "content": "<s>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "2": {
-      "content": "</s>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    }
-  },
-  "bos_token": "<s>",
-  "clean_up_tokenization_spaces": false,
-  "cls_token": "<CLS>",
-  "eos_token": "</s>",
-  "legacy": false,
-  "mask_token": "<MASK>",
-  "model_max_length": 4096,
-  "pad_token": "</s>",
-  "padding_side": "left",
-  "sep_token": "<SEP>",
-  "sp_model_kwargs": {},
-  "tokenizer_class": "LlamaTokenizer",
-  "unk_token": "<unk>",
-  "use_default_system_prompt": false
-}