meshalJcheema
/

Qwen2-0.5B-GRPO-test

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

Qwen2-0.5B-GRPO-test / runs

25.7 kB

1 contributor

History: 11 commits

meshalJcheema's picture

Training in progress, step 3

0bcdcb0 verified 6 months ago