JayHyeon
/

Qwen_1.5B-math-VDPO_5e-6_3.0vpo_constant-5ep

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Metrics Training metrics Community

Qwen_1.5B-math-VDPO_5e-6_3.0vpo_constant-5ep

Commit History

End of training

b5270d5
verified

JayHyeon commited on Jun 18

Model save

0976a3f
verified

JayHyeon commited on Jun 18

Training in progress, step 185

dbb03cd
verified

JayHyeon commited on Jun 18

initial commit

b4fc46e
verified

JayHyeon commited on Jun 18