JayHyeon
/

Qwen_0.5-rDPO_3e-6_1.0vpo_constant-1ep_0.3flip

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Metrics Training metrics Community

Qwen_0.5-rDPO_3e-6_1.0vpo_constant-1ep_0.3flip / vocab.json

JayHyeon's picture

Training in progress, step 970

6b26fff verified about 2 months ago

history contribute delete

2.78 MB

File too large to display, you can check the raw version instead.