luckeciano
/

Qwen-2.5-7B-GRPO-Base-32Action_779

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen-2.5-7B-GRPO-Base-32Action_779

Commit History

Training in progress, step 60

8935961
verified

luckeciano commited on 11 days ago

Training in progress, step 50

9227d11
verified

luckeciano commited on 11 days ago

Training in progress, step 40

585312f
verified

luckeciano commited on 11 days ago

Training in progress, step 30

bde4f85
verified

luckeciano commited on 11 days ago

Training in progress, step 20

00fed2e
verified

luckeciano commited on 11 days ago

Training in progress, step 10

31db8d1
verified

luckeciano commited on 11 days ago

initial commit

9792261
verified

luckeciano commited on 11 days ago