luckeciano
/

Qwen-2.5-7B-GRPO-Base-16Action_933

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen-2.5-7B-GRPO-Base-16Action_933 / trainer_state.json

luckeciano's picture

Model save

0b9aaf6 verified 13 days ago

history contribute delete

764 kB

File too large to display, you can check the raw version instead.