luckeciano
/

Qwen-2.5-7B-GRPO-Base-16Action_933

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen-2.5-7B-GRPO-Base-16Action_933

Commit History

End of training

dc44ae6
verified

luckeciano commited on 13 days ago

Model save

0b9aaf6
verified

luckeciano commited on 13 days ago

Training in progress, step 100

c8c375f
verified

luckeciano commited on 13 days ago

Training in progress, step 90

bb1421e
verified

luckeciano commited on 13 days ago

Training in progress, step 80

786a43a
verified

luckeciano commited on 13 days ago

Training in progress, step 70

f1db87b
verified

luckeciano commited on 13 days ago

Training in progress, step 60

00110a3
verified

luckeciano commited on 14 days ago

Training in progress, step 50

52cd465
verified

luckeciano commited on 14 days ago

Training in progress, step 40

a23f3b7
verified

luckeciano commited on 14 days ago

Training in progress, step 30

4cec2e2
verified

luckeciano commited on 14 days ago

Training in progress, step 20

10eaa49
verified

luckeciano commited on 14 days ago

Training in progress, step 10

cc46c96
verified

luckeciano commited on 14 days ago

initial commit

a07ce9a
verified

luckeciano commited on 14 days ago