sergeyzh commited on
Commit
0901537
·
verified ·
1 Parent(s): 8c35638

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +9 -1
README.md CHANGED
@@ -15,6 +15,7 @@ tags:
15
  - transformers
16
 
17
  license: mit
 
18
 
19
  ---
20
 
@@ -22,7 +23,14 @@ license: mit
22
 
23
  Быстрая модель BERT для расчетов компактных эмбедингов предложений на русском языке. Модель основана на [cointegrated/rubert-tiny2](https://huggingface.co/cointegrated/rubert-tiny2) - имеет аналогичные размеры контекста (2048), ембединга (312) и быстродействие. Является первой и самой быстрой моделью в серии BERT-sts.
24
 
25
- На STS и близких задачах (PI, NLI, SA, TI) для русского языка превосходит по качеству LaBSE. Оптимальна для использования в составе RAG LLMs при инференсе на CPU. Для работы с контекстом свыше 512 токенов требует дообучения под целевой домен.
 
 
 
 
 
 
 
26
 
27
  ## Использование модели с библиотекой `transformers`:
28
 
 
15
  - transformers
16
 
17
  license: mit
18
+ base_model: cointegrated/rubert-tiny2
19
 
20
  ---
21
 
 
23
 
24
  Быстрая модель BERT для расчетов компактных эмбедингов предложений на русском языке. Модель основана на [cointegrated/rubert-tiny2](https://huggingface.co/cointegrated/rubert-tiny2) - имеет аналогичные размеры контекста (2048), ембединга (312) и быстродействие. Является первой и самой быстрой моделью в серии BERT-sts.
25
 
26
+ На STS и близких задачах (PI, NLI, SA, TI) для русского языка превосходит по качеству LaBSE. Для работы с контекстом свыше 512 токенов требует дообучения под целевой домен.
27
+
28
+ ## Быстрая модель для использования в составе RAG LLMs при инференсе на CPU:
29
+ - отличный метрики на задачах STS, PI, NLI обеспечивают высокое качество при нечетких запросах;
30
+ - средние показатели на задачах SA, TI снижают влияние авторского стиля и личного отношения автора на ембединг;
31
+ - высокая скорость работы на CPU (> 1k предложений в секунду) позволяет легко расширять базу текстовых документов;
32
+ - пониженная размерность эмбединга (312) ускоряет дальнейшую работу алгоритмов knn при поиске соответствий;
33
+ - совместимость с [SentenceTransformer](https://github.com/UKPLab/sentence-transformers) позволяет проверить модель на своих данных с минимальным объемом кода.
34
 
35
  ## Использование модели с библиотекой `transformers`:
36