akhauriyash
/

DeepSeek-R1-Distill-Qwen-1.5B-GRPO-SpeculativeReasoner

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

DeepSeek-R1-Distill-Qwen-1.5B-GRPO-SpeculativeReasoner / README.md

Commit History

End of training

d597d1e
verified

akhauriyash commited on Apr 19

Model save

5896a5c
verified

akhauriyash commited on Apr 19