chirag12
/

Qwen2-0.5B-GRPO-test

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

Qwen2-0.5B-GRPO-test / runs

18.3 kB

1 contributor

History: 23 commits

chirag12's picture

Training in progress, step 226

647368d verified 8 months ago

Feb07_08-57-55_default
Training in progress, step 226 8 months ago