Upload folder using huggingface_hub

Files changed (6) hide show

README.md CHANGED Viewed

@@ -18,8 +18,8 @@ This model was merged using the [SCE](https://arxiv.org/abs/2408.07990) merge me
 ### Models Merged
 The following models were included in the merge:
-* /kaggle/input/llama-3-swallow-8b-v0.1/transformers/hf/1
 * /kaggle/input/llama-3-youko-8b/transformers/hf/1
 * /kaggle/input/meta-llama-3-8b-instruct/transformers/hf/1
 ### Configuration
@@ -33,16 +33,12 @@ models:
   - model: /kaggle/input/meta-llama-3-8b/transformers/hf/1
   # Target models
   - model: /kaggle/input/meta-llama-3-8b-instruct/transformers/hf/1
-    parameters:
-      select_topk: 0.8
   - model: /kaggle/input/llama-3-youko-8b/transformers/hf/1
-    parameters:
-      select_topk: 0.65
   - model: /kaggle/input/llama-3-swallow-8b-v0.1/transformers/hf/1
-    parameters:
-      select_topk: 0.65
 merge_method: sce
 base_model: /kaggle/input/meta-llama-3-8b/transformers/hf/1
 dtype: bfloat16
 ```

 ### Models Merged
 The following models were included in the merge:
 * /kaggle/input/llama-3-youko-8b/transformers/hf/1
+* /kaggle/input/llama-3-swallow-8b-v0.1/transformers/hf/1
 * /kaggle/input/meta-llama-3-8b-instruct/transformers/hf/1
 ### Configuration
   - model: /kaggle/input/meta-llama-3-8b/transformers/hf/1
   # Target models
   - model: /kaggle/input/meta-llama-3-8b-instruct/transformers/hf/1
   - model: /kaggle/input/llama-3-youko-8b/transformers/hf/1
   - model: /kaggle/input/llama-3-swallow-8b-v0.1/transformers/hf/1
 merge_method: sce
 base_model: /kaggle/input/meta-llama-3-8b/transformers/hf/1
+parameters:
+  select_topk: 0.65
 dtype: bfloat16
 ```

mergekit_config.yml CHANGED Viewed

@@ -4,14 +4,10 @@ models:
   - model: /kaggle/input/meta-llama-3-8b/transformers/hf/1
   # Target models
   - model: /kaggle/input/meta-llama-3-8b-instruct/transformers/hf/1
-    parameters:
-      select_topk: 0.8
   - model: /kaggle/input/llama-3-youko-8b/transformers/hf/1
-    parameters:
-      select_topk: 0.65
   - model: /kaggle/input/llama-3-swallow-8b-v0.1/transformers/hf/1
-    parameters:
-      select_topk: 0.65
 merge_method: sce
 base_model: /kaggle/input/meta-llama-3-8b/transformers/hf/1
 dtype: bfloat16

   - model: /kaggle/input/meta-llama-3-8b/transformers/hf/1
   # Target models
   - model: /kaggle/input/meta-llama-3-8b-instruct/transformers/hf/1
   - model: /kaggle/input/llama-3-youko-8b/transformers/hf/1
   - model: /kaggle/input/llama-3-swallow-8b-v0.1/transformers/hf/1
 merge_method: sce
 base_model: /kaggle/input/meta-llama-3-8b/transformers/hf/1
+parameters:
+  select_topk: 0.65
 dtype: bfloat16

model-00001-of-00004.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:d4e5e358de8c0553d792d7632ed81ef59f800b6b201eff0fb20fb0c013c657b3
+size 4953586384

model-00002-of-00004.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:cc17beb40559194f0ad3b9446fe3338c4ec4d704cb06faf3437e89803a789882
+size 4999819336

model-00003-of-00004.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:b233cdafea1798c767ec2b549a8007c3aa8d8473adddb61501b97a919364fa33
+size 4915916144

model-00004-of-00004.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:24de7c106f6c73c8ba75b8f10af6ad776b242e541cc9a61cb2ccebe01e778198
+size 1191234472