Edit Models filters

Apps

Docker Model Runner

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

106

Full-text search

Active filters: llmcompressor

NoorNizar/Llama-3.2-3B-Instruct-WINT8

Text Generation • 4B • Updated Apr 23 • 17

NoorNizar/Meta-Llama-3-8B-Instruct-WFP8

Text Generation • 8B • Updated Apr 21 • 12

NoorNizar/Meta-Llama-3-8B-Instruct-WINT8

Text Generation • 8B • Updated Apr 21 • 12

RedHatAI/Qwen3-4B-quantized.w4a16

Text Generation • 1B • Updated May 13 • 809

RedHatAI/Qwen3-32B-FP8-dynamic

Text Generation • 33B • Updated May 13 • 3.21k • 11

RedHatAI/Qwen3-0.6B-FP8-dynamic

Text Generation • 0.8B • Updated May 12 • 998

RedHatAI/Qwen3-8B-FP8-dynamic

Text Generation • 8B • Updated May 13 • 28.8k • 3

RedHatAI/Qwen3-4B-FP8-dynamic

Text Generation • 4B • Updated May 12 • 84

RedHatAI/Qwen3-14B-FP8-dynamic

Text Generation • 15B • Updated May 13 • 419 • 2

RedHatAI/Qwen3-1.7B-FP8-dynamic

Text Generation • 2B • Updated May 12 • 27

RedHatAI/Qwen3-0.6B-quantized.w4a16

Text Generation • 0.4B • Updated May 12 • 128

NoorNizar/Phi-4-mini-instruct-WINT4

Text Generation • 4B • Updated May 3 • 13

NoorNizar/Meta-Llama-3-8B-Instruct-WINT4

Text Generation • 8B • Updated May 3 • 11

NoorNizar/Llama-3.2-3B-Instruct-WINT4

Text Generation • 4B • Updated May 3 • 13

RedHatAI/Qwen3-30B-A3B-FP8-dynamic

Text Generation • 31B • Updated May 13 • 1.24k • 3

mratsim/GLM-4-32B-0414.w4a16-gptq

Text Generation • 6B • Updated May 25 • 882 • 3

RedHatAI/Qwen3-235B-A22B-FP8-dynamic

Text Generation • 235B • Updated May 6 • 2.1k • 2

RedHatAI/Qwen3-14B-quantized.w4a16

Text Generation • 3B • Updated May 13 • 1.11k

RedHatAI/Qwen3-8B-quantized.w4a16

Text Generation • 2B • Updated May 13 • 1.43k

RedHatAI/Qwen3-30B-A3B-quantized.w4a16

Text Generation • 5B • Updated May 13 • 6.25k • 3

BCCard/Qwen3-32B-FP8-Dynamic

Text Generation • 33B • Updated Jun 20 • 19

BCCard/Qwen3-30B-A3B-FP8-Dynamic

Text Generation • 31B • Updated Jun 20 • 14

GusPuffy/Legion-V2.1-LLaMa-70B-GPTQ

Text Generation • 11B • Updated May 23 • 14

mratsim/Devstral-Small-2505.w4a16-gptq

Text Generation • 4B • Updated May 26 • 332 • 2

RedHatAI/DeepSeek-R1-0528-quantized.w4a16

Text Generation • Updated Jun 2 • 1.68k • 9

duydq12/Qwen2.5-Coder-7B-Instruct-FP8-dynamic

Text Generation • 8B • Updated Jun 9 • 1

duydq12/Qwen2.5-7B-Instruct-1M-FP8-dynamic

Text Generation • 8B • Updated Jun 9 • 1

duydq12/Qwen2.5-14B-Instruct-1M-FP8-dynamic

Text Generation • 15B • Updated Jun 9 • 99

duydq12/Qwen2.5-Coder-14B-Instruct-FP8-dynamic

Text Generation • 15B • Updated Jun 9

duydq12/QwQ-32B-FP8-dynamic

Text Generation • 33B • Updated Jun 9