JayHyeon
/

Qwen_1.5B-math-DPO_5e-5_1.0vpo_constant-10ep

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Metrics Training metrics Community

Qwen_1.5B-math-DPO_5e-5_1.0vpo_constant-10ep

Commit History

End of training

16ce009
verified

JayHyeon commited on Jun 19

Model save

56d5ba5
verified

JayHyeon commited on Jun 19

Training in progress, step 370

20cb5cb
verified

JayHyeon commited on Jun 19

initial commit

44efc69
verified

JayHyeon commited on Jun 19