BERTopicを日本語webデータで訓練したモデルです。
- modelはtopic_model.binを直接wgetなどでダウンロードください。
from bertopic import BERTopic
model_path = "data/topic_model.bin"
topic_model = BERTopic.load(model_path)
docs=["こんにちは",
"吾輩は猫である",
]
categories = topic_model.transform(docs)[0]
- 訓練コードはtrain_topic_model.ipynbを参照ください
- 340カテゴリ程度に分割されます
- 履歴
- 2024/3/12訓練