Kunger
/

Sakura-13B-v0.11Pre-4Bit-AWQ-No-flash_attn

4Bit AWQ量化，未测试，不建议使用。

采用未安装flash_attn的环境进行量化

Intel-XPU测试用，该量化模型可能不适合所有人。

Safetensors

Model size

2.69B params

Tensor type

I32

BF16

FP16

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support