Andrija commited on
Commit
62bec84
·
1 Parent(s): 323cc8f

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +1 -1
README.md CHANGED
@@ -4,4 +4,4 @@ tokenizer = RobertaTokenizerFast.from_pretrained('Andrija/RobertaFastBPE', bos_t
4
  encoded = tokenizer('Stručnjaci te bolnice, predvođeni dr Alisom Lim')
5
  # {'input_ids': [0, 47541, 34632, 603, 24817, 16, 27540, 6768, 2350, 2803, 3991, 2733, 81, 1], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]}
6
  tokenizer.decode(encoded['input_ids'])
7
- # &lts&gtStručnjaci te bolnice, predvođeni dr Alisom Lim&lt/s&gt
 
4
  encoded = tokenizer('Stručnjaci te bolnice, predvođeni dr Alisom Lim')
5
  # {'input_ids': [0, 47541, 34632, 603, 24817, 16, 27540, 6768, 2350, 2803, 3991, 2733, 81, 1], 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]}
6
  tokenizer.decode(encoded['input_ids'])
7
+ # <s>Stručnjaci te bolnice, predvođeni dr Alisom Lim</s>