JayHyeon
/

Qwen_0.5-IRPO_1e-6-3ep_0.25alp_0.5bdpo_lam_0dpop_lam

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen_0.5-IRPO_1e-6-3ep_0.25alp_0.5bdpo_lam_0dpop_lam

Ctrl+K

Ctrl+K

1 contributor

History: 6 commits

JayHyeon's picture

End of training

22eb486 verified about 2 months ago