chengzl18
/

thucbert-cm

Inference Endpoints

Model card Files Files and versions Community

chengzl18 commited on Mar 21, 2023

Commit

def1786

•

1 Parent(s): c786dd0

Upload with huggingface_hub

Files changed (2) hide show

pytorch_model.bin +1 -1
tokenizer_config.json +8 -2

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c0d0cb6b55adc4722fed62a367f3e54e0d510ee90926fab45f01540bb5c32d1c
 size 382042873

 version https://git-lfs.github.com/spec/v1
+oid sha256:914b38d56f0084daeb0388f7a3282b780f9fd199162188471cad63952678f77f
 size 382042873

tokenizer_config.json CHANGED Viewed

@@ -4,13 +4,19 @@
   "do_lower_case": true,
   "mask_token": "[MASK]",
   "model_max_length": 1000000000000000019884624838656,
-  "name_or_path": "output/_extracted_model/bert-base-chinese-extracted",
   "never_split": null,
   "pad_token": "[PAD]",
   "sep_token": "[SEP]",
   "special_tokens_map_file": null,
   "strip_accents": null,
   "tokenize_chinese_chars": true,
-  "tokenizer_class": "BertTokenizer",
   "unk_token": "[UNK]"
 }

   "do_lower_case": true,
   "mask_token": "[MASK]",
   "model_max_length": 1000000000000000019884624838656,
+  "name_or_path": "bert/tokenizer/bert-base-chinese-char-cm",
   "never_split": null,
   "pad_token": "[PAD]",
   "sep_token": "[SEP]",
   "special_tokens_map_file": null,
   "strip_accents": null,
   "tokenize_chinese_chars": true,
+  "tokenizer_class": "ChineseCharTokenizer",
+  "auto_map": {
+    "AutoTokenizer": [
+      "cctokenizer.ChineseCharTokenizer",
+      null
+      ]
+  },
   "unk_token": "[UNK]"
 }