DeepSeek-R1-Distill-Qwen-14B的训练/推理模板改变
#22
by
fxb
- opened
Qwen/Qwen2.5-14B 的 "chat_template": " ...... {{- '<|im_start|>assistant\n' }}\n{%- endif %}\n"
deepseek-ai/DeepSeek-R1-Distill-Qwen-14B 的 "chat_template": "...... {{'<|Assistant|>\n'}}{% endif %}"
DeepSeek-R1-Distill-Qwen-14B不是只是在Qwen2.5-14B的基础上进行了sft吗?为什么chat templete中的标签改变了呢?更改这个是基于什么考虑呢?