Safetensors
mixtral
Kaz-K commited on
Commit
c1b1cbe
·
verified ·
0 Parent(s):

initial commitment

Browse files
Files changed (2) hide show
  1. .gitattributes +35 -0
  2. README.md +107 -0
.gitattributes ADDED
@@ -0,0 +1,35 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ *.7z filter=lfs diff=lfs merge=lfs -text
2
+ *.arrow filter=lfs diff=lfs merge=lfs -text
3
+ *.bin filter=lfs diff=lfs merge=lfs -text
4
+ *.bz2 filter=lfs diff=lfs merge=lfs -text
5
+ *.ckpt filter=lfs diff=lfs merge=lfs -text
6
+ *.ftz filter=lfs diff=lfs merge=lfs -text
7
+ *.gz filter=lfs diff=lfs merge=lfs -text
8
+ *.h5 filter=lfs diff=lfs merge=lfs -text
9
+ *.joblib filter=lfs diff=lfs merge=lfs -text
10
+ *.lfs.* filter=lfs diff=lfs merge=lfs -text
11
+ *.mlmodel filter=lfs diff=lfs merge=lfs -text
12
+ *.model filter=lfs diff=lfs merge=lfs -text
13
+ *.msgpack filter=lfs diff=lfs merge=lfs -text
14
+ *.npy filter=lfs diff=lfs merge=lfs -text
15
+ *.npz filter=lfs diff=lfs merge=lfs -text
16
+ *.onnx filter=lfs diff=lfs merge=lfs -text
17
+ *.ot filter=lfs diff=lfs merge=lfs -text
18
+ *.parquet filter=lfs diff=lfs merge=lfs -text
19
+ *.pb filter=lfs diff=lfs merge=lfs -text
20
+ *.pickle filter=lfs diff=lfs merge=lfs -text
21
+ *.pkl filter=lfs diff=lfs merge=lfs -text
22
+ *.pt filter=lfs diff=lfs merge=lfs -text
23
+ *.pth filter=lfs diff=lfs merge=lfs -text
24
+ *.rar filter=lfs diff=lfs merge=lfs -text
25
+ *.safetensors filter=lfs diff=lfs merge=lfs -text
26
+ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
27
+ *.tar.* filter=lfs diff=lfs merge=lfs -text
28
+ *.tar filter=lfs diff=lfs merge=lfs -text
29
+ *.tflite filter=lfs diff=lfs merge=lfs -text
30
+ *.tgz filter=lfs diff=lfs merge=lfs -text
31
+ *.wasm filter=lfs diff=lfs merge=lfs -text
32
+ *.xz filter=lfs diff=lfs merge=lfs -text
33
+ *.zip filter=lfs diff=lfs merge=lfs -text
34
+ *.zst filter=lfs diff=lfs merge=lfs -text
35
+ *tfevents* filter=lfs diff=lfs merge=lfs -text
README.md ADDED
@@ -0,0 +1,107 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ license: apache-2.0
3
+ ---
4
+ # SIP-med-LLM/SIP-jmed-llm-2-8x13b-OP-instruct
5
+
6
+ このモデルは、<b>戦略的イノベーション創造プログラム(SIP)第 3 期課題「統合型ヘルスケアシステムの構築における生成 AI 活用」テーマ1「安全性・信頼性を持つオープンな医療 LLM の開発・社会実装」</b>において研究開発された、医療特化型 LLM のオープンソースライセンス・モデル(`Apache-2.0`)です。
7
+
8
+ #### プロジェクトページ: https://sip3.ncgm.go.jp/
9
+
10
+ ## モデルの特性
11
+
12
+ `SIP-jmed-llm-2-8x13b-OP-instruct` は、ベースモデルである `llm-jp/llm-jp-3-8x13b` に対して、医学分野の知識を取り扱えるようにドメイン適応を施した大規模言語モデルです。
13
+
14
+ ## モデルの概要
15
+
16
+ - **ベースモデル**: [llm-jp/llm-jp-3-8x13b](https://huggingface.co/llm-jp/llm-jp-3-8x13b)に対して、SIPプロジェクトで収集した0.3T汎用コーパスで事前学習を実施したモデル
17
+ - **モデルタイプ**: トランスフォーマーベースの言語モデル
18
+ - **言語**: 日本語・英語
19
+ - **ライセンス**: Apache-2.0
20
+ - **開発者**: SIP 第 3 期 テーマ 1 研究開発チーム
21
+
22
+ ## 使用目的と制限事項
23
+
24
+ このモデルは「安全性・信頼性を持つオープンな医療 LLM の開発・社会実装」における研究開発プロトタイプとして開発されました。**現段階では研究開発目的のみでの使用を想定しており、実際の臨床現場における疾患の診断や臨床意思決定支援として直接利用することは推奨されません。**
25
+
26
+ #### 制限事項
27
+
28
+ - **本モデルは研究開発段階のプロトタイプであり、実臨床における安全性・有効性の検証は十分に行われていません。**
29
+ - 開発者は、本プログラムに関し、その正確性、完全性、最新性、および品質など、いかなる保証も行わず、利用者が本プログラムを利用したこと、利用できなかったことにより生じた一切の損害について責任を負いません。
30
+ - **医療行為(診断、治療方針の決定、健康への助言など)に直接適用することは推奨されません。あくまで医療専門家による適切な判断の補助となる情報提供ツールとしての利用可能性を探る研究段階にあります。**
31
+
32
+ ## 学習データ
33
+
34
+ 本モデルは以下のデータセットを用いて、ベースモデルを追加事前学習することにより開発されました:
35
+
36
+ ### 追加事前学習用データセット
37
+
38
+ 追加事前学習用データセットとして、主に以下の内容からなる医療系コーパス(トークン数 44.2B)を用いました。
39
+
40
+ ### 文書種別
41
+
42
+ - 医学生物学論文フルテキスト
43
+ - 医学生物学論文アブストラクト
44
+ - 医療系Webクロールデータ
45
+ - 学術研究レポート
46
+ - 医学教科書
47
+ - 薬剤添付文書
48
+ - 専門機関発行文書:
49
+ - 学会発行の診療ガイドライン
50
+ - 医療機関・行政機関による医療関連文書
51
+ - 製薬企業等による医療情報・医薬品情報
52
+ - ベンチマークの学習用データセット:医師国家試験過去問(2006年から2017年までの12年分)、USMLE過去問を含む
53
+
54
+ ### 指示チューニング用データセット
55
+
56
+ 追加事前学習の後、以下のデータセットを用いた指示チューニングも実施されています。
57
+
58
+ - SIPプロジェクトで開発された医療系指示チューニング用データセット
59
+ - [llm-jp/llm-jp-3-13b](https://huggingface.co/llm-jp/llm-jp-3-13b) が公開している指示チューニング用データセットの一部
60
+ - 医療系ベンチマークデータセットの学習用データセット(医師国家試験過去問題や USMLE 過去問題など)
61
+
62
+ ## 必要なライブラリ
63
+
64
+ - torch>=2.3.0
65
+ - transformers>=4.40.1
66
+ - tokenizers>=0.19.1
67
+ - accelerate>=0.29.3
68
+ - flash-attn>=2.5.8
69
+
70
+ ## 使用方法
71
+
72
+ ```python
73
+ import torch
74
+ from transformers import AutoTokenizer, AutoModelForCausalLM
75
+ tokenizer = AutoTokenizer.from_pretrained("llm-jp/llm-jp-3-8x13b-instruct")
76
+ model = AutoModelForCausalLM.from_pretrained("SIP-med-LLM/SIP-jmed-llm-2-8x13b-OP-instruct", device_map="auto", torch_dtype=torch.bfloat16)
77
+ chat = [
78
+ {"role": "system", "content": "以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。"},
79
+ {"role": "user", "content": "心筋梗塞の主要な症状を教えて下さい。"},
80
+ ]
81
+ tokenized_input = tokenizer.apply_chat_template(chat, add_generation_prompt=True, tokenize=True, return_tensors="pt").to(model.device)
82
+ with torch.no_grad():
83
+ output = model.generate(
84
+ tokenized_input,
85
+ max_new_tokens=100,
86
+ do_sample=True,
87
+ top_p=0.95,
88
+ temperature=0.7,
89
+ repetition_penalty=1.05,
90
+ )[0]
91
+ print(tokenizer.decode(output))
92
+ ```
93
+
94
+ ## 技���仕様の詳細
95
+
96
+ トークナイザーなどの詳細な技術仕様については、[llm-jp/llm-jp-3-8x13b](https://huggingface.co/llm-jp/llm-jp-3-8x13b)のページを参照してください。
97
+
98
+ ## メンテナンス情報
99
+
100
+ - リリース日: 2025 年 4 月 30 日
101
+ - 最終更新日: 2025 年 4 月 30 日
102
+ - バージョン: 1.0.0
103
+ - 問い合わせ先: [[email protected]]([email protected]) へご連絡ください。
104
+
105
+ ## 謝辞
106
+
107
+ 本モデルの開発にあたり、コーパス構築において国立国語研究所(NINJAL)より日本語コーパスの提供を受けました。また、科学技術振興機構(JST)にはJ-GLOBAL収載の医学論文アブストラクトデータを提供いただきました。両機関のご協力に深く感謝申し上げます。