haouarin
/

jais-13b-chat-GPTQ-4bits

Text Generation

4-bit precision

Model card Files Files and versions Community

haouarin commited on Sep 6, 2023

Commit

ecd905c

·

1 Parent(s): 7b52672

Create README.md

Files changed (1) hide show

README.md +28 -0

README.md ADDED Viewed

	@@ -0,0 +1,28 @@

+This is the quantized version 4-bits created using autotrain, but it doesn't work.
+## Error
+### GPU
+![image/png](https://cdn-uploads.huggingface.co/production/uploads/62de65017e93762b858d3057/M0OoBfV1WC1QcLumyvy0L.png)
+### CPU
+![image/png](https://cdn-uploads.huggingface.co/production/uploads/62de65017e93762b858d3057/ezLq3jhasIg--M-jJAMSI.png)
+## Quantization Process
+```py
+!pip install auto-gptq
+!pip install git+https://github.com/huggingface/optimum.git
+!pip install git+https://github.com/huggingface/transformers.git
+!pip install --upgrade accelerate
+```
+```py
+from transformers import AutoModelForCausalLM, AutoTokenizer,GPTQConfig
+tokenizer = AutoTokenizer.from_pretrained("inception-mbzuai/jais-13b-chat")
+gptq_config = GPTQConfig(bits=4, dataset = "c4", tokenizer=tokenizer)
+model = AutoModelForCausalLM.from_pretrained('inception-mbzuai/jais-13b-chat', quantization_config=gptq_config,trust_remote_code=True)
+```