RedHatAI
/

Meta-Llama-3.1-8B-quantized.w8a16

Text Generation

text-generation-inference

compressed-tensors

Model card Files Files and versions

Meta-Llama-3.1-8B-quantized.w8a16

Ctrl+K

Ctrl+K

2 contributors

History: 8 commits

mgoin's picture

Updated compression_config to quantization_config

b65e953 verified 8 months ago