JayHyeon
/

Qwen_0.5-IRPO_1e-6-3ep_0.25alp_0.5bdpo_lam_0dpop_lam

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen_0.5-IRPO_1e-6-3ep_0.25alp_0.5bdpo_lam_0dpop_lam

Commit History

End of training

22eb486
verified

JayHyeon commited on Jun 27

Model save

d962347
verified

JayHyeon commited on Jun 27

Training in progress, step 2913

332f353
verified

JayHyeon commited on Jun 27

Training in progress, step 2000

97743a0
verified

JayHyeon commited on Jun 27

Training in progress, step 1000

eefe735
verified

JayHyeon commited on Jun 27

initial commit

6ba89d7
verified

JayHyeon commited on Jun 27