Add library and pipeline tag, link to paper
Browse filesThis PR adds the Transformers library tag as well as the text generation pipeline tag to this model. It also links to the paper associated with this model.
README.md
CHANGED
@@ -1,15 +1,20 @@
|
|
1 |
---
|
2 |
-
license: mit
|
3 |
base_model:
|
4 |
- ai-sage/GigaChat-20B-A3B-base
|
5 |
language:
|
6 |
- ru
|
7 |
- en
|
|
|
|
|
|
|
8 |
---
|
|
|
9 |
# GigaChat-20B-A3B-instruct
|
10 |
|
11 |
Диалоговая модель из семейства моделей GigaChat, основная на [GigaChat-20B-A3B-base](https://huggingface.co/ai-sage/GigaChat-20B-A3B-base). Поддерживает контекст в 131 тысячу токенов.
|
12 |
|
|
|
|
|
13 |
Больше подробностей в [хабр статье](https://habr.com/en/companies/sberdevices/articles/865996/).
|
14 |
|
15 |
**Для данной модели также доступны веса в [bf16](https://huggingface.co/ai-sage/GigaChat-20B-A3B-instruct-bf16) и [int8](https://huggingface.co/ai-sage/GigaChat-20B-A3B-instruct-int8)**
|
@@ -141,5 +146,4 @@ curl http://localhost:8000/v1/chat/completions \
|
|
141 |
{"role": "user", "content": "Докажи теорему о неподвижной точке"}
|
142 |
]
|
143 |
}'
|
144 |
-
```
|
145 |
-
|
|
|
1 |
---
|
|
|
2 |
base_model:
|
3 |
- ai-sage/GigaChat-20B-A3B-base
|
4 |
language:
|
5 |
- ru
|
6 |
- en
|
7 |
+
license: mit
|
8 |
+
library_name: transformers
|
9 |
+
pipeline_tag: text-generation
|
10 |
---
|
11 |
+
|
12 |
# GigaChat-20B-A3B-instruct
|
13 |
|
14 |
Диалоговая модель из семейства моделей GigaChat, основная на [GigaChat-20B-A3B-base](https://huggingface.co/ai-sage/GigaChat-20B-A3B-base). Поддерживает контекст в 131 тысячу токенов.
|
15 |
|
16 |
+
This repository contains the instructed model of [GigaChat Family: Efficient Russian Language Modeling Through Mixture of Experts Architecture](https://huggingface.co/papers/2506.09440).
|
17 |
+
|
18 |
Больше подробностей в [хабр статье](https://habr.com/en/companies/sberdevices/articles/865996/).
|
19 |
|
20 |
**Для данной модели также доступны веса в [bf16](https://huggingface.co/ai-sage/GigaChat-20B-A3B-instruct-bf16) и [int8](https://huggingface.co/ai-sage/GigaChat-20B-A3B-instruct-int8)**
|
|
|
146 |
{"role": "user", "content": "Докажи теорему о неподвижной точке"}
|
147 |
]
|
148 |
}'
|
149 |
+
```
|
|