mssfj
/

Llama3_2_3B_GRPO_LoRA-GSM8K-250step

Text Generation

text-generation-inference

Model card Files Files and versions Community

Llama3_2_3B_GRPO_LoRA-GSM8K-250step

Ctrl+K

Ctrl+K

1 contributor

History: 3 commits

mssfj's picture

Trained with Unsloth

5cf7e4b verified 12 days ago