luckeciano
/

Qwen-2.5-7B-GRPO-Base-32Action_223

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen-2.5-7B-GRPO-Base-32Action_223 / all_results.json

Commit History

Model save

aa2a041
verified

luckeciano commited on 12 days ago

Training in progress, step 10

5a2e2fa
verified

luckeciano commited on 12 days ago