babylm-baseline-100m-gpt-bert-mixed / tokenizer_config.json

Upload fully trained model (1B tokens)

462ad22 verified 19 days ago

230 Bytes

	{
	"tokenizer_class": "PreTrainedTokenizerFast",
	"bos_token": "<s>",
	"eos_token": "</s>",
	"unk_token": "<unk>",
	"sep_token": "</s>",
	"pad_token": "<pad>",
	"cls_token": "<s>",
	"mask_token": "<mask>"
	}