Azzedde
/

llama3.1-8b-reasoning-grpo

Text Generation

text-generation-inference

Model card Files Files and versions Community

llama3.1-8b-reasoning-grpo

Commit History

Update README.md

001bb8f
verified

Azzedde commited on Mar 3

Trained with Unsloth

334ec97
verified

Azzedde commited on Mar 3

Upload tokenizer

b9a527c
verified

Azzedde commited on Mar 3

Upload README.md with huggingface_hub

2d6db2c
verified

Azzedde commited on Mar 3

initial commit

70bacfb
verified

Azzedde commited on Mar 3