DeepSeek-R1-Distill-Qwen-14B的训练/推理模板改变

#22
by fxb - opened

Qwen/Qwen2.5-14B 的 "chat_template": " ...... {{- '<|im_start|>assistant\n' }}\n{%- endif %}\n"
deepseek-ai/DeepSeek-R1-Distill-Qwen-14B 的 "chat_template": "...... {{'<|Assistant|>\n'}}{% endif %}"

DeepSeek-R1-Distill-Qwen-14B不是只是在Qwen2.5-14B的基础上进行了sft吗?为什么chat templete中的标签改变了呢?更改这个是基于什么考虑呢?

Sign up or log in to comment