JayHyeon
/

Qwen_1.5B-math-VDPO_5e-6_3.0vpo_constant-5ep

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Metrics Training metrics Community

Qwen_1.5B-math-VDPO_5e-6_3.0vpo_constant-5ep / tokenizer_config.json

Commit History

Training in progress, step 185

dbb03cd
verified

JayHyeon commited on Jun 18