Model fine-tuning - a rishavranaut Collection

Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

rishavranaut 's Collections

Model fine-tuning

Model fine-tuning

updated Mar 30

fine tune different models

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 404
agents-course/notebooks

Updated about 20 hours ago • 408
rishavranaut/Gemmafinetuning

Updated Mar 30

Collection guide
Browse collections

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs