ukr-models commited on
Commit
d2f61d5
·
1 Parent(s): ff96650

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +25 -0
README.md ADDED
@@ -0,0 +1,25 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - uk
4
+ tags:
5
+ - ukrainian
6
+ widget:
7
+ - text: "упродовж 2012-2014 років національний природний парк «зачарований край» разом із всесвітнім фондом природи wwf успішно реалізували проект із відновлення болота «чорне багно» розташованого на схилах гори бужора у закарпатті водноболотне угіддя «чорне багно» є найбільшою болотною екосистемою регіону воно займає площу близько 15 га унікальністю цього високогірного болота розташованого на висоті 840 м над рівнем моря є велика потужність торфових покладів (глибиною до 59 м) і своєрідна рослинність у 50-х і на початку 60-х років минулого століття на природних потічках що протікали через болото побудували осушувальні канали це порушило природну рівновагу відтак змінилася екосистема болота"
8
+ license: mit
9
+ ---
10
+ ## Model Description
11
+ Fine-tuning of [XLM-RoBERTa-Uk](https://huggingface.co/ukr-models/xlm-roberta-base-uk) model on Ukrainian texts to recover punctuation and case.
12
+
13
+ ## How to Use
14
+
15
+ Download script get_predictions.py from the repository.
16
+ ```py
17
+ from transformers import AutoTokenizer, AutoModelForTokenClassification
18
+ from get_predictions import recover_text
19
+
20
+ tokenizer = AutoTokenizer.from_pretrained('ukr-models/uk-punctcase')
21
+ model = AutoModelForTokenClassification.from_pretrained('ukr-models/uk-punctcase')
22
+
23
+ text = "..."
24
+ recover_text(text_processed, model, tokenizer)
25
+ ```