NibiruTwin commited on
Commit
68f6b99
·
verified ·
1 Parent(s): c8dd634

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +7 -2
README.md CHANGED
@@ -11,7 +11,6 @@ language:
11
  - en
12
  - ja
13
  datasets:
14
- - kinokokoro/ichikara-instruction-003
15
  - weblab-GENIAC/aya-ja-nemotron-dpo-masked
16
  ---
17
 
@@ -69,9 +68,12 @@ https://huggingface.co/NibiruTwin/llm-jp-3-13b-c_it
69
  のデータセットを使用しました。
70
 
71
  A100の環境を用いても、DPOを回すのはGPUのメモリが足りなかったり、epoch数に限界があったので
72
- num_train_epochs = 3,
73
 
 
 
 
74
  ```
 
75
  でtrainしました。
76
 
77
 
@@ -126,8 +128,11 @@ TrainOutput(global_step=36, training_loss=0.00038064550871139445, metrics={'trai
126
  ```
127
 
128
  結果として大喜利については以下のような答えになっていました。
 
129
 
130
  [使用した/できそうなデータセット一覧(各自追加していただけるとありがたいです)](https://www.notion.so/6adbd79a4bc148da8ec1a5012572918f?pvs=21)
 
131
  Apache license 2.0
132
  weblab-GENIAC/aya-ja-nemotron-dpo-masked
 
133
  [<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/unsloth%20made%20with%20love.png" width="200"/>](https://github.com/unslothai/unsloth)
 
11
  - en
12
  - ja
13
  datasets:
 
14
  - weblab-GENIAC/aya-ja-nemotron-dpo-masked
15
  ---
16
 
 
68
  のデータセットを使用しました。
69
 
70
  A100の環境を用いても、DPOを回すのはGPUのメモリが足りなかったり、epoch数に限界があったので
 
71
 
72
+
73
+ ```
74
+ num_train_epochs = 3,
75
  ```
76
+
77
  でtrainしました。
78
 
79
 
 
128
  ```
129
 
130
  結果として大喜利については以下のような答えになっていました。
131
+ {"task_id": 68, "input": "大喜利に挑戦してみましょう。大喜利とはお題に対して面白い回答を考える遊びです。大喜利のコツは色々とありますが、1つは「共感を呼ぶ答えをひとひねりする」ことです。誰もが経験したことや思ったことに対して、少し変わった視点や表現で回答することで、共感と笑いを誘うことができます。\n\nそれでは、以下のお題について大喜利で答えてください。\nお題:人間と仲良くなりたい妖精が取った行動とは?", "output": "\n人間と仲良くなりたい妖精が、ある日突然やってきて、こう言いました。\n\n「私、この仕事向いてません。辞めたいんです。あなたの会社紹介してもらえませんか?」"}
132
 
133
  [使用した/できそうなデータセット一覧(各自追加していただけるとありがたいです)](https://www.notion.so/6adbd79a4bc148da8ec1a5012572918f?pvs=21)
134
+
135
  Apache license 2.0
136
  weblab-GENIAC/aya-ja-nemotron-dpo-masked
137
+
138
  [<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/unsloth%20made%20with%20love.png" width="200"/>](https://github.com/unslothai/unsloth)