Edit Models filters

Inference Providers

HF Inference API

Misc

preference-optimization

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

8

Full-text search

Active filters: preference-optimization

tokutsu/japanese-answer-13b-8bit

Updated Apr 21 • 7

HaiZhiYan/CheX-Phi35V

Visual Question Answering • Updated Jul 14 • 2

tahamajs/llama-3.2-3b-orpo-lora64-4bit-instruct

Updated Apr 3 • 3

Likhith003/dpo-pairrm-lora-adapter

Text Generation • 1B • Updated Apr 19 • 5

Likhith003/dpo-llmjudge-lora-adapter

Text Generation • 1B • Updated Apr 19 • 5

jasperyeoh2/mistral-dpo-peft

Updated Apr 25 • 5

loganlin777/mistral-7b-dpo-adapter

gandhiraketla277/finance-llama-3.1-8b-dpo-trained

Text Generation • Updated 10 days ago • 23