entai2965
/

sugoi-v4-ja-en-ctranslate2

Model card Files Files and versions Community

entai2965 commited on Nov 20, 2024

Commit

6ac670f

·

verified ·

1 Parent(s): 58e4034

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -95,7 +95,7 @@ translator = ctranslate2.Translator(model_path, device=device)
 tokenizer_for_source_language = sentencepiece.SentencePieceProcessor(sentencepiece_model_path+'/spm.ja.nopretok.model')
 tokenizer_for_target_language = sentencepiece.SentencePieceProcessor(sentencepiece_model_path+'/spm.en.nopretok.model')
-#perform black magic
 translated_batch=[tokenizer_for_target_language.decode(tokens.hypotheses[0]).replace('<unk>','') for tokens in translator.translate_batch(source=[tokenizer_for_source_language.encode(text,out_type=str) for text in raw_list],beam_size=5)]
 assert(len(raw_list)==len(translated_batch))

 tokenizer_for_source_language = sentencepiece.SentencePieceProcessor(sentencepiece_model_path+'/spm.ja.nopretok.model')
 tokenizer_for_target_language = sentencepiece.SentencePieceProcessor(sentencepiece_model_path+'/spm.en.nopretok.model')
+#invoke black magic
 translated_batch=[tokenizer_for_target_language.decode(tokens.hypotheses[0]).replace('<unk>','') for tokens in translator.translate_batch(source=[tokenizer_for_source_language.encode(text,out_type=str) for text in raw_list],beam_size=5)]
 assert(len(raw_list)==len(translated_batch))