Update README.md
Browse files
README.md
CHANGED
@@ -11,7 +11,6 @@ language:
|
|
11 |
- en
|
12 |
- ja
|
13 |
datasets:
|
14 |
-
- kinokokoro/ichikara-instruction-003
|
15 |
- weblab-GENIAC/aya-ja-nemotron-dpo-masked
|
16 |
---
|
17 |
|
@@ -69,9 +68,12 @@ https://huggingface.co/NibiruTwin/llm-jp-3-13b-c_it
|
|
69 |
のデータセットを使用しました。
|
70 |
|
71 |
A100の環境を用いても、DPOを回すのはGPUのメモリが足りなかったり、epoch数に限界があったので
|
72 |
-
num_train_epochs = 3,
|
73 |
|
|
|
|
|
|
|
74 |
```
|
|
|
75 |
でtrainしました。
|
76 |
|
77 |
|
@@ -126,8 +128,11 @@ TrainOutput(global_step=36, training_loss=0.00038064550871139445, metrics={'trai
|
|
126 |
```
|
127 |
|
128 |
結果として大喜利については以下のような答えになっていました。
|
|
|
129 |
|
130 |
[使用した/できそうなデータセット一覧(各自追加していただけるとありがたいです)](https://www.notion.so/6adbd79a4bc148da8ec1a5012572918f?pvs=21)
|
|
|
131 |
Apache license 2.0
|
132 |
weblab-GENIAC/aya-ja-nemotron-dpo-masked
|
|
|
133 |
[<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/unsloth%20made%20with%20love.png" width="200"/>](https://github.com/unslothai/unsloth)
|
|
|
11 |
- en
|
12 |
- ja
|
13 |
datasets:
|
|
|
14 |
- weblab-GENIAC/aya-ja-nemotron-dpo-masked
|
15 |
---
|
16 |
|
|
|
68 |
のデータセットを使用しました。
|
69 |
|
70 |
A100の環境を用いても、DPOを回すのはGPUのメモリが足りなかったり、epoch数に限界があったので
|
|
|
71 |
|
72 |
+
|
73 |
+
```
|
74 |
+
num_train_epochs = 3,
|
75 |
```
|
76 |
+
|
77 |
でtrainしました。
|
78 |
|
79 |
|
|
|
128 |
```
|
129 |
|
130 |
結果として大喜利については以下のような答えになっていました。
|
131 |
+
{"task_id": 68, "input": "大喜利に挑戦してみましょう。大喜利とはお題に対して面白い回答を考える遊びです。大喜利のコツは色々とありますが、1つは「共感を呼ぶ答えをひとひねりする」ことです。誰もが経験したことや思ったことに対して、少し変わった視点や表現で回答することで、共感と笑いを誘うことができます。\n\nそれでは、以下のお題について大喜利で答えてください。\nお題:人間と仲良くなりたい妖精が取った行動とは?", "output": "\n人間と仲良くなりたい妖精が、ある日突然やってきて、こう言いました。\n\n「私、この仕事向いてません。辞めたいんです。あなたの会社紹介してもらえませんか?」"}
|
132 |
|
133 |
[使用した/できそうなデータセット一覧(各自追加していただけるとありがたいです)](https://www.notion.so/6adbd79a4bc148da8ec1a5012572918f?pvs=21)
|
134 |
+
|
135 |
Apache license 2.0
|
136 |
weblab-GENIAC/aya-ja-nemotron-dpo-masked
|
137 |
+
|
138 |
[<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/unsloth%20made%20with%20love.png" width="200"/>](https://github.com/unslothai/unsloth)
|