JayHyeon
/

Qwen_1.5B-math-DPO_5e-5_1.0vpo_constant-10ep

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Metrics Training metrics Community

Qwen_1.5B-math-DPO_5e-5_1.0vpo_constant-10ep / generation_config.json

Commit History

Model save

56d5ba5
verified

JayHyeon commited on Jun 19