nvidia
/

Llama-3_3-Nemotron-Super-49B-v1-FP8

Text Generation

Model card Files Files and versions Community

Llama-3_3-Nemotron-Super-49B-v1-FP8 / hf_quant_config.json

Tugrul's picture

Add files using upload-large-folder tool

7721052 verified 28 days ago

history blame contribute delete

256 Bytes

	{
	"producer": {
	"name": "modelopt",
	"version": "0.28.1.dev62+g0f520225"
	},
	"quantization": {
	"quant_algo": "FP8",
	"kv_cache_quant_algo": "FP8",
	"exclude_modules": [
	"lm_head"
	]
	}
	}