lordChipotle
/

Llama3GRPOReasoning

Reinforcement Learning

Model card Files Files and versions Community

Llama3GRPOReasoning / model-00003-of-00004.safetensors

Commit History

Upload LlamaForCausalLM

b3ebf5c
verified

lordChipotle commited on 9 days ago