Hacoo1234
/

Qwen2-0.5B-GRPO-SeqLenTest512

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

Qwen2-0.5B-GRPO-SeqLenTest512 / runs

Ctrl+K

Ctrl+K

1 contributor

History: 12 commits

Hacoo1234's picture

Model save

0a7d1c4 verified 22 days ago