daichira
/

llm-jp-3-13b-itnew9

@@ -33,7 +33,7 @@ This llama model was trained 2x faster with [Unsloth](https://github.com/unsloth
 ## **特徴**
 - **モデル名:** `llm-jp-3-13b-itnew9`
-- **ベースモデル:** `llm-jp/llm-jp-3-13b-finetune2`
 - **微調整目的:** 日本語の指示応答能力を強化。
 - **量子化:** 4bit (qLoRA)
 - **LoRA設定:**
@@ -118,11 +118,9 @@ print(response)
 ## **注意点と制約**
 - 本モデルは日本語の指示応答タスクに特化しており、他のタスクや言語での性能は保証されません。
 - ライセンス条件により、商用利用は許可されていません。
-```
-#実行コード
 # Google Colabの場合はunslothのインストールのみを行ってください
 !pip uninstall unsloth -y && pip install --upgrade --no-cache-dir "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git"
@@ -148,11 +146,10 @@ load_in_4bit = True # 今回は8Bクラスのモデルを扱うためTrue
 model_id = "daichira/llm-jp-3-13b-finetune2"
-#llm-jp-3-13b-finetune2:ベースモデルをichikara-instruction-003-001-1.jsonでsft
 new_model_id = "llm-jp-3-13b-itnew9" #Fine-Tuningしたモデルにつけたい名前
 # FastLanguageModel インスタンスを作成
 model, tokenizer = FastLanguageModel.from_pretrained(
     model_name=model_id,
@@ -235,7 +232,6 @@ formatting_prompts_func: 各データをプロンプトに合わせた形式に
 """
 EOS_TOKEN = tokenizer.eos_token # トークナイザーのEOSトークン（文末トークン）
 def formatting_prompts_func(examples):
-#    input = examples["text"] # 入力データ
     input = examples["instruction"] # 入力データ
     output = examples["output"] # 出力データ
     text = prompt.format(input, output) + EOS_TOKEN # プロンプトの作成
@@ -285,7 +281,6 @@ trainer_stats = trainer.train()
 # ELYZA-tasks-100-TVの読み込み。事前にファイルをアップロードしてください
 # データセットの読み込み。
-# omnicampusの開発環境では、左にタスクのjsonlをドラッグアンドドロップしてから実行。
 import json
 datasets = []
 #with open("./elyza-tasks-100-TV_0.jsonl", "r") as f:
@@ -322,3 +317,4 @@ with open(f"{new_model_id}_output.jsonl", 'w', encoding='utf-8') as f:
     for result in results:
         json.dump(result, f, ensure_ascii=False)
         f.write('\n')

 ## **特徴**
 - **モデル名:** `llm-jp-3-13b-itnew9`
+- **ベースモデル:** `llm-jp/llm-jp-3-13b`
 - **微調整目的:** 日本語の指示応答能力を強化。
 - **量子化:** 4bit (qLoRA)
 - **LoRA設定:**
 ## **注意点と制約**
 - 本モデルは日本語の指示応答タスクに特化しており、他のタスクや言語での性能は保証されません。
 - ライセンス条件により、商用利用は許可されていません。
+## **実行コード**
 # Google Colabの場合はunslothのインストールのみを行ってください
 !pip uninstall unsloth -y && pip install --upgrade --no-cache-dir "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git"
 model_id = "daichira/llm-jp-3-13b-finetune2"
+#llm-jp-3-13b-finetune2:llm-jp/llm-jp-3-13bをichikara-instruction-003-001-1.jsonでsft
 new_model_id = "llm-jp-3-13b-itnew9" #Fine-Tuningしたモデルにつけたい名前
 # FastLanguageModel インスタンスを作成
 model, tokenizer = FastLanguageModel.from_pretrained(
     model_name=model_id,
 """
 EOS_TOKEN = tokenizer.eos_token # トークナイザーのEOSトークン（文末トークン）
 def formatting_prompts_func(examples):
     input = examples["instruction"] # 入力データ
     output = examples["output"] # 出力データ
     text = prompt.format(input, output) + EOS_TOKEN # プロンプトの作成
 # ELYZA-tasks-100-TVの読み込み。事前にファイルをアップロードしてください
 # データセットの読み込み。
 import json
 datasets = []
 #with open("./elyza-tasks-100-TV_0.jsonl", "r") as f:
     for result in results:
         json.dump(result, f, ensure_ascii=False)
         f.write('\n')
+```