mssfj
/

Llama3_2_3B_GRPO_LoRA-GSM8K-250step

Text Generation

text-generation-inference

Model card Files Files and versions Community

Llama3_2_3B_GRPO_LoRA-GSM8K-250step

Commit History

Trained with Unsloth

5cf7e4b
verified

mssfj commited on 13 days ago

Upload tokenizer

0bab040
verified

mssfj commited on 13 days ago

initial commit

c98a4e9
verified

mssfj commited on 13 days ago