dumbequation
/

Qwen2.5-7B-GRPO-1M-Context-Medical-Reasoning-f16

Text Generation

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-7B-GRPO-1M-Context-Medical-Reasoning-f16

Commit History

Update README.md

d7897f4
verified

dumbequation commited on Mar 4

Trained with Unsloth

1666e4b
verified

dumbequation commited on Feb 22

Upload tokenizer

22aef59
verified

dumbequation commited on Feb 22

Upload README.md with huggingface_hub

1e95780
verified

dumbequation commited on Feb 22

initial commit

b538aa3
verified

dumbequation commited on Feb 22