akbarsigit
/

llama3.1-grpo-r256-a512-base-lora

text-generation-inference

Model card Files Files and versions Community

llama3.1-grpo-r256-a512-base-lora

Ctrl+K

Ctrl+K

1 contributor

History: 4 commits

akbarsigit's picture

Trained with Unsloth

d9232ad verified about 1 month ago