Edit Models filters

Apps

Docker Model Runner

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

9,208

Full-text search

Active filters: dpo

QuantFactory/Qwen2.5-14B-Gutenberg-Instruct-Slerpeno-GGUF

15B • Updated Sep 21, 2024 • 43 • 2

QuantFactory/Qwen2.5-14B-Gutenberg-1e-Delta-GGUF

15B • Updated Sep 22, 2024 • 86 • 2

tanliboy/lambda-qwen2.5-32b-dpo-test

Text Generation • 33B • Updated Sep 22, 2024 • 8 • 5

mradermacher/Qwen2.5-Lumen-14B-i1-GGUF

15B • Updated Sep 22, 2024 • 528 • 8

taicheng/zephyr-7b-align-scan-dpo0.1data-5e-07-0.01-1-cosine-8

Text Generation • 7B • Updated Sep 24, 2024 • 3

QuantFactory/L3.1-Niitorm-8B-DPO-t0.0001-GGUF

8B • Updated Sep 22, 2024 • 18 • 3

Triangle104/Qwen2.5-14B-Gutenberg-1e-Delta-Q4_0-GGUF

15B • Updated Sep 22, 2024 • 7 • 1

Triangle104/Qwen2.5-14B-Gutenberg-1e-Delta-Q4_K_S-GGUF

15B • Updated Sep 22, 2024 • 2 • 1

Triangle104/Qwen2.5-14B-Gutenberg-1e-Delta-Q4_K_M-GGUF

15B • Updated Sep 22, 2024 • 3 • 1

Triangle104/Qwen2.5-14B-Gutenberg-1e-Delta-Q5_0-GGUF

15B • Updated Sep 22, 2024 • 4 • 1

Triangle104/Qwen2.5-14B-Gutenberg-1e-Delta-Q5_K_S-GGUF

15B • Updated Sep 22, 2024 • 4 • 1

LBK95/Llama-2-7b-hf-DPO-LookAhead3_FullEval_TTree1.4_TLoop0.7_TEval0.2_Filter0.2_V3.0

Updated Sep 23, 2024 • 2

Triangle104/Qwen2.5-14B-Gutenberg-1e-Delta-Q5_K_M-GGUF

15B • Updated Sep 22, 2024 • 2 • 1

Triangle104/Qwen2.5-14B-Gutenberg-1e-Delta-Q6_K-GGUF

15B • Updated Sep 22, 2024 • 5 • 1

Triangle104/Qwen2.5-14B-Gutenberg-1e-Delta-Q8_0-GGUF

15B • Updated Sep 22, 2024 • 2 • 1

tsavage68/IE_M2_1000steps_1e5rate_01beta_cSFTDPO

Text Generation • 7B • Updated Sep 23, 2024 • 5

tsavage68/IE_M2_1000steps_1e5rate_03beta_SFT

Text Generation • 7B • Updated Sep 23, 2024 • 3

DUAL-GPO/zephyr-7b-ipo-10k-40k-0.001-i1

Updated Sep 23, 2024 • 2

Katayoon/VPO-Pess-Zephyr-7B-iter-1

7B • Updated Sep 23, 2024 • 4

tsavage68/IE_L3_1000steps_1e5rate_01beta_cSFTDPO

Text Generation • 8B • Updated Sep 23, 2024 • 3

tsavage68/IE_M2_1000steps_1e5rate_05beta_cSFTDPO

Text Generation • 7B • Updated Sep 23, 2024 • 3

tsavage68/IE_M2_1000steps_1e6rate_01beta_cSFTDPO

Text Generation • 7B • Updated Sep 23, 2024 • 3

tsavage68/IE_M2_1000steps_1e6rate_03beta_cSFTDPO

Text Generation • 7B • Updated Sep 23, 2024 • 3

tsavage68/IE_M2_1000steps_1e6rate_05beta_cSFTDPO

Text Generation • 7B • Updated Sep 23, 2024 • 3

Katayoon/VPO-Pess-Zephyr-7B-iter-2

7B • Updated Sep 23, 2024 • 4

tsavage68/IE_L3_1000steps_1e5rate_03beta_SFT

Text Generation • 8B • Updated Sep 23, 2024 • 3

tsavage68/IE_M2_1000steps_1e7rate_01beta_cSFTDPO

Text Generation • 7B • Updated Sep 23, 2024 • 3

tsavage68/IE_L3_1000steps_1e5rate_05beta_cSFTDPO

Text Generation • 8B • Updated Sep 23, 2024 • 3

tsavage68/IE_M2_1000steps_1e7rate_03beta_SFT

Text Generation • 7B • Updated Sep 23, 2024 • 3

tsavage68/IE_L3_1000steps_1e6rate_01beta_cSFTDPO

Text Generation • 8B • Updated Sep 23, 2024 • 3