yichunkuo
/

Llama-2-7b-hf-gptq

GPTQ quantized falcon-rw-1b

Branch	Bits	GS	Act Order	Damp %	GPTQ Dataset	Seq Len	Size	ExLlama	Desc
main	4	None	No	0.01	c4	4096	--	No	4-bit, without Act Order and no grouop size.

Safetensors

Model size

1.08B params

Tensor type

I32

FP16

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support