akhauriyash
/

DeepSeek-R1-Distill-Qwen-1.5B-GRPO-SpeculativeReasoner

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

DeepSeek-R1-Distill-Qwen-1.5B-GRPO-SpeculativeReasoner / tokenizer_config.json

Commit History

Training in progress, step 30

a8e45f8
verified

akhauriyash commited on Apr 17