stabilityai
/

stablelm-2-zephyr-1_6b

Text Generation

Model card Files Files and versions

jon-tow commited on Jan 25, 2024

Commit

e795a4e

·

verified ·

1 Parent(s): 8b1a48d

fix(tokenizer): expose `errors`

Files changed (1) hide show

tokenization_arcade100k.py +2 -0

tokenization_arcade100k.py CHANGED Viewed

@@ -111,6 +111,8 @@ class Arcade100kTokenizer(PreTrainedTokenizer):
         **kwargs,
     ):
         super().__init__(errors=errors, **kwargs)
         self._tiktoken_config = _arcade100k(vocab_file)
         self.tokenizer = tiktoken.Encoding(**self._tiktoken_config)

         **kwargs,
     ):
         super().__init__(errors=errors, **kwargs)
+        self.errors = errors
         self._tiktoken_config = _arcade100k(vocab_file)
         self.tokenizer = tiktoken.Encoding(**self._tiktoken_config)