JayHyeon
/

Qwen_0.5-IRPO_5e-7-3ep_0.01alp_0.5bdpo_lam_0dpop_lam

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen_0.5-IRPO_5e-7-3ep_0.01alp_0.5bdpo_lam_0dpop_lam

Commit History

End of training

a7d1731
verified

JayHyeon commited on Jun 28

Model save

8c99da3
verified

JayHyeon commited on Jun 28

Training in progress, step 2913

b48bcff
verified

JayHyeon commited on Jun 28

Training in progress, step 2000

85b610b
verified

JayHyeon commited on Jun 28

Training in progress, step 1000

917a9b8
verified

JayHyeon commited on Jun 28

initial commit

775c0f8
verified

JayHyeon commited on Jun 28