davidkim205
commited on
Commit
โข
9c3bc62
1
Parent(s):
f8388af
Update README.md
Browse files
README.md
CHANGED
@@ -20,6 +20,76 @@ davidkim205/ko-gemma-2-9b-it is one of several models being researched to improv
|
|
20 |
* **base mode** : google/gemma-2-9b-it
|
21 |
* **sft dataset** : qa_ability_1851.jsonl
|
22 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
23 |
## Benchmark
|
24 |
|
25 |
### kollm_evaluation
|
|
|
20 |
* **base mode** : google/gemma-2-9b-it
|
21 |
* **sft dataset** : qa_ability_1851.jsonl
|
22 |
|
23 |
+
## Usage
|
24 |
+
### Chat Template
|
25 |
+
```
|
26 |
+
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
|
27 |
+
|
28 |
+
model_id = "davidkim205/ko-gemma-2-9b-it"
|
29 |
+
|
30 |
+
quantization_config = BitsAndBytesConfig(load_in_4bit=True)
|
31 |
+
|
32 |
+
tokenizer = AutoTokenizer.from_pretrained(model_id)
|
33 |
+
model = AutoModelForCausalLM.from_pretrained(
|
34 |
+
model_id,
|
35 |
+
quantization_config=quantization_config)
|
36 |
+
|
37 |
+
chat = [
|
38 |
+
{ "role": "system", "content":"๋น์ ์ ์ง๋ฌธ์ ๋ํด์ ์์ธํ ์ค๋ช
ํ๋ AI์
๋๋ค."},
|
39 |
+
{ "role": "user", "content": "๋ฅ๋ฌ๋์ ์ด๋ป๊ฒ ๊ณต๋ถํด์ผํ๋์?" },
|
40 |
+
]
|
41 |
+
prompt = tokenizer.apply_chat_template(chat, tokenize=False, add_generation_prompt=True)
|
42 |
+
inputs = tokenizer.encode(prompt, add_special_tokens=False, return_tensors="pt")
|
43 |
+
outputs = model.generate(input_ids=inputs.to(model.device), max_new_tokens=1024)
|
44 |
+
print(tokenizer.decode(outputs[0]))
|
45 |
+
|
46 |
+
```
|
47 |
+
output
|
48 |
+
```
|
49 |
+
`low_cpu_mem_usage` was None, now set to True since model is quantized.
|
50 |
+
Loading checkpoint shards: 100%|โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ| 4/4 [00:04<00:00, 1.04s/it]
|
51 |
+
/home/david/anaconda3/envs/eval/lib/python3.10/site-packages/bitsandbytes/nn/modules.py:426: UserWarning: Input type into Linear4bit is torch.float16, but bnb_4bit_compute_dtype=torch.float32 (default). This will lead to slow inference or training speed.
|
52 |
+
warnings.warn(
|
53 |
+
<bos>๋น์ ์ ์ง๋ฌธ์ ๋ํด์ ์์ธํ ์ค๋ช
ํ๋ AI์
๋๋ค.<start_of_turn>user
|
54 |
+
๋ฅ๋ฌ๋์ ์ด๋ป๊ฒ ๊ณต๋ถํด์ผํ๋์?<end_of_turn>
|
55 |
+
<start_of_turn>model
|
56 |
+
๋ฅ๋ฌ๋์ ๊ณต๋ถํ๋ ๊ฒ์ ํฅ๋ฏธ๋กญ๊ณ ๋ณด๋ ์๋ ์ฌ์ ์ด ๋ ์ ์์ต๋๋ค!
|
57 |
+
|
58 |
+
ํ์ง๋ง ์ด๋์๋ถํฐ ์์ํด์ผ ํ ์ง ๋ง๋งํ๊ฒ ๋๊ปด์ง ์๋ ์์ต๋๋ค.
|
59 |
+
|
60 |
+
๋ค์์ ๋ฅ๋ฌ๋์ ๊ณต๋ถํ๊ธฐ ์ํ ๋จ๊ณ๋ณ ๊ฐ์ด๋์
๋๋ค.
|
61 |
+
|
62 |
+
**1๋จ๊ณ: ๊ธฐ์ด ๋ค์ง๊ธฐ**
|
63 |
+
|
64 |
+
* **์ํ**: ๋ฅ๋ฌ๋์ ๊ธฐ๋ฐ์ด ๋๋ ์ ํ๋์, ๋ฏธ์ ๋ถ, ํ๋ฅ ๋ฐ ํต๊ณ์ ๋ํ ๊ธฐ๋ณธ ์ง์์ด ํ์ํฉ๋๋ค. Khan Academy, Coursera ๋ฑ ์จ๋ผ์ธ ํ๋ซํผ์์ ์ํ ๊ฐ์ข๋ฅผ ๋ฃ๋ ๊ฒ์ ์ถ์ฒํฉ๋๋ค.
|
65 |
+
* **ํ๋ก๊ทธ๋๋ฐ**: Python์ ๋ฅ๋ฌ๋ ๋ถ์ผ์์ ๊ฐ์ฅ ๋๋ฆฌ ์ฌ์ฉ๋๋ ํ๋ก๊ทธ๋๋ฐ ์ธ์ด์
๋๋ค. Python ๊ธฐ์ด ๋ฌธ๋ฒ, ๋ฐ์ดํฐ ๊ตฌ์กฐ, ํจ์ ๋ฑ์ ์ตํ์ธ์. Codecademy, Google's Python Class ๋ฑ์ ํ๋ซํผ์์ Python์ ๋ฐฐ์ธ ์ ์์ต๋๋ค.
|
66 |
+
* **๊ธฐ๋ณธ ๋จธ์ ๋ฌ๋**: ๋ฅ๋ฌ๋์ ์ดํดํ๊ธฐ ์ ์ ๊ธฐ๋ณธ์ ์ธ ๋จธ์ ๋ฌ๋ ๊ฐ๋
์ ์ตํ๋ ๊ฒ์ด ์ค์ํฉ๋๋ค.
|
67 |
+
* ๋ถ๋ฅ, ํ๊ท, ํด๋ฌ์คํฐ๋ง ๋ฑ์ ๋จธ์ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ดํดํ๊ณ , Scikit-learn ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ํ์ฉํ์ฌ ์ค์ต์ ํด๋ณด์ธ์.
|
68 |
+
|
69 |
+
**2๋จ๊ณ: ๋ฅ๋ฌ๋ ๊ฐ๋
ํ์ต**
|
70 |
+
|
71 |
+
* **์จ๋ผ์ธ ๊ฐ์ข**: Coursera, edX, Udacity ๋ฑ์ ํ๋ซํผ์์ ์ ๊ณตํ๋ ๋ฅ๋ฌ๋ ๊ฐ์ข๋ฅผ ์๊ฐํ์ธ์. Andrew Ng์ Deep Learning Specialization์ ๋ฅ๋ฌ๋ ๋ถ์ผ์ ๊ธฐ๋ณธ ๊ฐ๋
์ ํํํ๊ฒ ๋ค์ง๋ ๋ฐ ์ข์ ์ ํ์
๋๋ค.
|
72 |
+
* **์ฑ
**: ๋ฅ๋ฌ๋์ ๋ํ ์ดํด๋ฅผ ์ฌํ์ํค๊ธฐ ์ํด ์ฑ
์ ์ฝ๋ ๊ฒ๋ ์ข์ ๋ฐฉ๋ฒ์
๋๋ค.
|
73 |
+
* "Deep Learning" (Ian Goodfellow, Yoshua Bengio, Aaron Courville)์ ๋ฅ๋ฌ๋ ๋ถ์ผ์ ์ ๋ฌธ๊ฐ๋ฅผ ์ํ ์ฌ๋ ์๋ ์ฑ
์
๋๋ค.
|
74 |
+
* "Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow" (Aurรฉlien Gรฉron)์ ์ค์ต ์ค์ฌ์ผ๋ก ๋ฅ๋ฌ๋์ ๋ฐฐ์ฐ๊ณ ์ถ์ ์ฌ๋์๊ฒ ์ ํฉํฉ๋๋ค.
|
75 |
+
* **๋ธ๋ก๊ทธ ๋ฐ ๊ธฐ์ฌ**: ๋ฅ๋ฌ๋ ๊ด๋ จ ์ต์ ํธ๋ ๋์ ์ฐ๊ตฌ ๋ํฅ์ ํ์
ํ๊ธฐ ์ํด ๋ธ๋ก๊ทธ ๋ฐ ๊ธฐ์ฌ๋ฅผ ์ฝ๋ ๊ฒ์ด ์ข์ต๋๋ค.
|
76 |
+
|
77 |
+
**3๋จ๊ณ: ์ค์ต ๋ฐ ํ๋ก์ ํธ ์งํ**
|
78 |
+
|
79 |
+
* **๋ฐ์ดํฐ์
**: Kaggle, UCI Machine Learning Repository ๋ฑ์ ํ๋ซํผ์์ ๋ค์ํ ๋ฐ์ดํฐ์
์ ์ฐพ์ ์ค์ตํ ์ ์์ต๋๋ค.
|
80 |
+
* **๋ผ์ด๋ธ๋ฌ๋ฆฌ**: TensorFlow, PyTorch, Keras ๋ฑ์ ๋ฅ๋ฌ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ํ์ฉํ์ฌ ๋ชจ๋ธ์ ๊ตฌ์ถํ๊ณ ํ๋ จํ์ธ์.
|
81 |
+
* **ํ๋ก์ ํธ**: ๋ฅ๋ฌ๋ ๊ธฐ์ ์ ์ ์ฉํ์ฌ ์ค์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ํ๋ก์ ํธ๋ฅผ ์งํํ๋ ๊ฒ์ด ์ค์ํฉ๋๋ค.
|
82 |
+
* ์ด๋ฏธ์ง ๋ถ๋ฅ, ์์ฐ์ด ์ฒ๋ฆฌ, ์์ธก ๋ชจ๋ธ ๊ฐ๋ฐ ๋ฑ ๋ค์ํ ํ๋ก์ ํธ๋ฅผ ํตํด ๋ฅ๋ฌ๋ ์ค๋ ฅ์ ํฅ์์ํฌ ์ ์์ต๋๋ค.
|
83 |
+
|
84 |
+
**์ถ๊ฐ ํ**
|
85 |
+
|
86 |
+
* **์ปค๋ฎค๋ํฐ ํ๋**: ๋ฅ๋ฌ๋ ๊ด๋ จ ์ปค๋ฎค๋ํฐ์ ์ฐธ์ฌํ์ฌ ๋ค๋ฅธ ์ฌ๋๋ค๊ณผ ๊ต๋ฅํ๊ณ ์ง๋ฌธ์ ํด๋ณด์ธ์.
|
87 |
+
* **๊พธ์คํจ**: ๋ฅ๋ฌ๋์ ๋ณต์กํ ๋ถ์ผ์ด๋ฏ๋ก ๊พธ์คํ ๊ณต๋ถํ๊ณ ์ค์ตํ๋ ๊ฒ์ด ์ค์ํฉ๋๋ค.
|
88 |
+
|
89 |
+
|
90 |
+
<end_of_turn><eos>
|
91 |
+
|
92 |
+
```
|
93 |
## Benchmark
|
94 |
|
95 |
### kollm_evaluation
|