lordChipotle
/

Llama3GRPOReasoning

Reinforcement Learning

Model card Files Files and versions Community

Llama3GRPOReasoning

Ctrl+K

Ctrl+K

1 contributor

History: 12 commits

lordChipotle's picture

Update README.md

b6e7b7a verified about 2 months ago