radm
/

DeepSeek-R1-Distill-Llama-8B-orpo

Text Generation

text-generation-inference

Model card Files Files and versions Community

DeepSeek-R1-Distill-Llama-8B-orpo

Commit History

Update README.md

9795332
verified

radm commited on 25 days ago

Update README.md

258e36d
verified

radm commited on 25 days ago

Upload tokenizer

53c81ab
verified

radm commited on 25 days ago

Upload merged model with LoRA adapters

9fdc168
verified

radm commited on 25 days ago

initial commit

99a5d7f
verified

radm commited on 25 days ago