weege007
/

Qwen2.5-0.5B-Instruct_grpo_Countdown-Tasks-3to4

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Metrics Training metrics Community

Qwen2.5-0.5B-Instruct_grpo_Countdown-Tasks-3to4 / logs

Ctrl+K

Ctrl+K

1 contributor

History: 4 commits

weege007's picture

Training in progress, step 100

b1b9809 verified 26 days ago

events.out.tfevents.1749367842.modal.2.0

6.19 kB
LFS

Training in progress, step 25 26 days ago
events.out.tfevents.1749367951.modal.2.0

6.19 kB
LFS

Training in progress, step 25 26 days ago
events.out.tfevents.1749368052.modal.2.0

6.19 kB
LFS

Training in progress, step 25 26 days ago
events.out.tfevents.1749368147.modal.2.0

6.19 kB
LFS

Training in progress, step 25 26 days ago
events.out.tfevents.1749368238.modal.2.0

86.3 kB
LFS

Training in progress, step 100 26 days ago