JayHyeon
/

Qwen_0.5-rDPO_3e-6_1.0vpo_constant-1ep_0.3flip

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Metrics Training metrics Community

Qwen_0.5-rDPO_3e-6_1.0vpo_constant-1ep_0.3flip / runs

Ctrl+K

Ctrl+K

1 contributor

History: 3 commits

JayHyeon's picture

Model save

cd23dae verified about 1 month ago