Update README.md
Browse files
README.md
CHANGED
@@ -65,7 +65,8 @@ https://huggingface.co/NibiruTwin/llm-jp-3-13b-c_it
|
|
65 |
それを、藤越さんの手法でDPOを用いて作成したのが今回のモデルです。
|
66 |
その際には
|
67 |
|
68 |
-
|
|
|
69 |
|
70 |
A100の環境を用いても、DPOを回すのはGPUのメモリが足りなかったり、epoch数に限界があったので
|
71 |
|
|
|
65 |
それを、藤越さんの手法でDPOを用いて作成したのが今回のモデルです。
|
66 |
その際には
|
67 |
|
68 |
+
`weblab-GENIAC/aya-ja-nemotron-dpo-masked`
|
69 |
+
のデータセットを使用しました。
|
70 |
|
71 |
A100の環境を用いても、DPOを回すのはGPUのメモリが足りなかったり、epoch数に限界があったので
|
72 |
|