rkumar1999
/

Llama3.2-3B-Prover-openr1-distill-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

Llama3.2-3B-Prover-openr1-distill-GRPO / runs

43.1 kB

1 contributor

History: 1 commit

rkumar1999's picture

Training in progress, epoch 0

59ed3e8 verified 25 days ago