|
--- |
|
license: apache-2.0 |
|
tags: |
|
- PyTorch |
|
- Transformers |
|
datasets: |
|
- tomaarsen/MultiCoNER |
|
language: |
|
- ru |
|
pipeline_tag: token-classification |
|
widget: |
|
- text: >- |
|
В Китайской Народной Республике отметили 170-летие публикации «Коммунистического манифеста», работы Карла Маркса и Фридриха Энгельса. |
|
- text: >- |
|
Тормозной башмак — приспособление для торможения и закрепления рельсового подвижного состава. |
|
- text: >- |
|
Участвовал в завоевании Крыма, состоял дежурным офицером при генерале князе Ю. В. Долгорукове. |
|
- text: >- |
|
В своей деятельности Банк России подотчетен Государственной Думе Федерального Собрания Российской Федерации. |
|
--- |
|
|
|
# RuBERT-MultiCoNER |
|
|
|
This is a BERT-based named entity recognizer for extracting named entities in Russian texts. Entities of the following six classes can be recognized: |
|
|
|
1. Persons, i.e. names of people (PER) |
|
2. Locations or physical facilities (LOC) |
|
3. Corporations and businesses (CORP) |
|
4. All other groups (GRP) |
|
5. Consumer products (PROD) |
|
6. Titles of creative works like movie, song, and book titles (CW). |