Descriptions

SSMモデルにより、LLMの厳しいハードウェア要求を引き下げることを目的にトレーニングしたモデル。 特に日本語への応答を滑らかにすることが主眼。

Result

モデルサイズのためか、学習ステップ数のためかあまりよい応答を返すようにならなかった。

Downloads last month
21
Safetensors
Model size
1.37B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for chatblanc-ciel/mamba-1.4b

Finetuned
(1)
this model

Datasets used to train chatblanc-ciel/mamba-1.4b