byh711
/

Qwen2.5-3B-MATH-GRPO-KOR

Reinforcement Learning

Model card Files Files and versions Community

Qwen2.5-3B-MATH-GRPO-KOR / added_tokens.json

Commit History

Upload tokenizer (Trained with Unsloth)

954338a
verified

byh711 commited on 6 days ago