metadata
license: apache-2.0
tags:
- PyTorch
- Transformers
datasets:
- tomaarsen/MultiCoNER
language:
- ru
pipeline_tag: token-classification
widget:
- text: >-
В Китайской Народной Республике отметили 170-летие публикации
«Коммунистического манифеста», работы Карла Маркса и Фридриха Энгельса.
- text: >-
Тормозной башмак — приспособление для торможения и закрепления рельсового
подвижного состава.
- text: >-
Участвовал в завоевании Крыма, состоял дежурным офицером при генерале
князе Ю. В. Долгорукове.
- text: >-
В своей деятельности Банк России подотчетен Государственной Думе
Федерального Собрания Российской Федерации.
RuBERT-MultiCoNER
This is a BERT-based named entity recognizer for extracting named entities in Russian texts. Entities of the following six classes can be recognized:
- Persons, i.e. names of people (PER)
- Locations or physical facilities (LOC)
- Corporations and businesses (CORP)
- All other groups (GRP)
- Consumer products (PROD)
- Titles of creative works like movie, song, and book titles (CW).