NibiruTwin
/

llm-jp-3-13b-it_lora-DPO-12-07

@@ -24,15 +24,22 @@ This llama model was trained 2x faster with [Unsloth](https://github.com/unsloth
 ・LLM2024コンペティションのために本モデルは作成いたしました。
-Language	Dataset	description
-Japanese	ichikara-instruction-003-001-1.json	A manually constructed instruction dataset
-データセット作成チーム： 関根聡, 安藤まや, 後藤美知子, 鈴木久美, 河原大輔, 井之上直也, 乾健太郎. ichikara-instruction: LLMのための日本語インストラクションデータの構築. 言語処理学会第30回年次大会(2024)
-Usage
 !pip install -U bitsandbytes
 !pip install -U transformers
 !pip install -U accelerate
 !pip install -U datasets
 from transformers import (
     AutoModelForCausalLM,
     AutoTokenizer,
@@ -55,7 +62,8 @@ model = AutoModelForCausalLM.from_pretrained(
     device_map="auto",
     token = HF_TOKEN
 )
 tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True, token = HF_TOKEN)
 datasets = []
 with open("./YOUR-DATA.jsonl", "r") as f:
@@ -75,7 +83,8 @@ for data in tqdm(datasets):
   {input}
   ### 回答：
   """
   tokenized_input = tokenizer.encode(prompt, add_special_tokens=False, return_tensors="pt").to(model.device)
   with torch.no_grad():
       outputs = model.generate(
@@ -93,9 +102,10 @@ with open(f"./{model_name}-outputs.jsonl", 'w', encoding='utf-8') as f:
     for result in results:
         json.dump(result, f, ensure_ascii=False)  # ensure_ascii=False for handling non-ASCII characters
         f.write('\n')
-作成時に考えたこと
 まずサンプルコードを回して回答を確認すると「RGBの問題」と、「大喜利」についてうまく答えられていないことがわかったため、
 それらに対して

 ・LLM2024コンペティションのために本モデルは作成いたしました。
+| Language | Language |
+| ---- | ---- |
+|Japanese| ichikara-instruction-003-001-1.json	A manually constructed instruction dataset|
+|データセット作成チーム|関根聡, 安藤まや, 後藤美知子, 鈴木久美, 河原大輔, 井之上直也, 乾健太郎. ichikara-instruction: LLMのための日本語インストラクションデータの構築. 言語処理学会第30回年次大会(2024)|
+〇Usage
+```
 !pip install -U bitsandbytes
 !pip install -U transformers
 !pip install -U accelerate
 !pip install -U datasets
+```
+```
 from transformers import (
     AutoModelForCausalLM,
     AutoTokenizer,
     device_map="auto",
     token = HF_TOKEN
 )
+```
+```
 tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True, token = HF_TOKEN)
 datasets = []
 with open("./YOUR-DATA.jsonl", "r") as f:
   {input}
   ### 回答：
   """
+```
+```
   tokenized_input = tokenizer.encode(prompt, add_special_tokens=False, return_tensors="pt").to(model.device)
   with torch.no_grad():
       outputs = model.generate(
     for result in results:
         json.dump(result, f, ensure_ascii=False)  # ensure_ascii=False for handling non-ASCII characters
         f.write('\n')
+```
+〇作成時に考えたこと
 まずサンプルコードを回して回答を確認すると「RGBの問題」と、「大喜利」についてうまく答えられていないことがわかったため、
 それらに対して