JayHyeon
/

Qwen_0.5-rDPO_3e-6_1.0vpo_constant-1ep_0.3flip

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Metrics Training metrics Community

Qwen_0.5-rDPO_3e-6_1.0vpo_constant-1ep_0.3flip / runs /Jun25_17-34-03_01933a260f36

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

JayHyeon's picture

Training in progress, step 970

6b26fff verified about 2 months ago

events.out.tfevents.1750873270.01933a260f36.1949948.0

12.8 kB
LFS

Training in progress, step 970 about 2 months ago