Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

41,733

Full-text search

Active filters: 4-bit

openbmb/MiniCPM-o-4_5-awq

Any-to-Any • 9B • Updated 6 days ago • 633 • 11

mlx-community/Kimi-K2.5

Text Generation • Updated 15 days ago • 1.31M • 25

lmstudio-community/Qwen3-Coder-Next-MLX-4bit

80B • Updated 9 days ago • 270k • 7

mlx-community/GLM-4.7-Flash-4bit

Text Generation • 30B • Updated 17 days ago • 27.2k • 53

mlx-community/Step-3.5-Flash-4bit

Text Generation • 197B • Updated 7 days ago • 2.26k • 6

mlx-community/Qwen3-Coder-Next-4bit

Text Generation • 80B • Updated 4 days ago • 1.96k • 5

nota-ai/Solar-Open-100B-NotaMoEQuant-Int4

Text Generation • 2B • Updated 16 days ago • 689 • 41

inferencerlabs/Kimi-K2.5-MLX-3.6bit

Text Generation • 1T • Updated 14 days ago • 3.74k • 14

mlx-community/Qwen3-ASR-0.6B-4bit

0.3B • Updated 13 days ago • 386 • 5

unsloth/Meta-Llama-3.1-8B-Instruct-bnb-4bit

Text Generation • 8B • Updated Feb 15, 2025 • 261k • 95

ubaitur5/Ministral-3b-instruct-Q4-mlx

Text Generation • 0.5B • Updated Jan 22, 2025 • 109 • 3

Qwen/Qwen3-0.6B-MLX-4bit

Text Generation • 83.9M • Updated Jul 29, 2025 • 451 • 20

unsloth/Qwen3-Next-80B-A3B-Instruct-bnb-4bit

Text Generation • Updated Sep 13, 2025 • 79k • 27

QuantTrio/GLM-4.7-AWQ

Text Generation • 358B • Updated Dec 29, 2025 • 19.5k • 25

Disty0/FLUX.2-klein-4B-SDNQ-4bit-dynamic

Text-to-Image • Updated 25 days ago • 8.17k • 7

EZCon/GLM-OCR-4bit-g32-mxfp4-mixed_4_8-mlx

Image-to-Text • 0.6B • Updated 6 days ago • 241 • 3

AxionLab-Co/DogeAI-v2.0-4B-Reasoning

Text Generation • 4B • Updated 3 days ago • 88 • 3

mlx-community/Voxtral-Mini-4B-Realtime-2602-4bit

Automatic Speech Recognition • 1B • Updated 1 day ago • 98 • 3

toby1991/Qwen3-Coder-Next-REAP-48B-A3B-4bit-mlx

Text Generation • 49B • Updated 3 days ago • 387 • 3

steampunque/Qwen3-Coder-Next-Hybrid-GGUF

80B • Updated 1 day ago • 22 • 3

TheBloke/Wizard-Vicuna-30B-Uncensored-GPTQ

Text Generation • 33B • Updated Sep 27, 2023 • 109k • 596

Qwen/Qwen2.5-32B-Instruct-AWQ

Text Generation • 33B • Updated Oct 9, 2024 • 872k • 92

MTSAIR/Cotype-Nano-4bit

Text Generation • 2B • Updated Nov 25, 2024 • 29 • 13

MaziyarPanahi/Qwen3-14B-GGUF

Text Generation • 15B • Updated Apr 28, 2025 • 275k • 7

Qwen/Qwen3-14B-AWQ

Text Generation • 15B • Updated May 21, 2025 • 877k • 55

Qwen/Qwen3-4B-AWQ

Text Generation • 4B • Updated May 21, 2025 • 107k • 24

Qwen/Qwen3-14B-MLX-4bit

Text Generation • 2B • Updated Jul 7, 2025 • 598 • 9

mlx-community/Qwen3-14B-4bit-DWQ-053125

Text Generation • Updated Jun 2, 2025 • 93 • 6

mlx-community/LFM2-350M-4bit

Text Generation • 55.4M • Updated Jul 11, 2025 • 390 • 6

lmstudio-community/Qwen3-Coder-30B-A3B-Instruct-MLX-4bit

Text Generation • 31B • Updated Jul 31, 2025 • 150k • 14