JayHyeon
/

Qwen_0.5-rDPO_3e-6_1.0vpo_constant-1ep_0.3flip

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Metrics Training metrics Community

Qwen_0.5-rDPO_3e-6_1.0vpo_constant-1ep_0.3flip / tokenizer_config.json

Commit History

Training in progress, step 970

4adfde5
verified

JayHyeon commited on Jun 26

Training in progress, step 971

f951824
verified

JayHyeon commited on Jun 26

Training in progress, step 970

6b26fff
verified

JayHyeon commited on Jun 25