LnL-AI
/

Yi-6B-gptq-4bit

Text Generation

4-bit precision

Model card Files Files and versions

Qubitium commited on Mar 28, 2024

Commit

f45ad20

·

verified ·

1 Parent(s): 51935d6

Update test.py

Files changed (1) hide show

test.py +3 -7

test.py CHANGED Viewed

@@ -3,19 +3,15 @@ from transformers import AutoTokenizer
 import torch
 model_id = "LnL-AI/Yi-6B-gptq-4bit"
 device = torch.device("cuda:0")
-model_q = AutoGPTQForCausalLM.from_quantized(model_id, use_safetensors=True, device=device)
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 prompt = "I am in Shanghai, preparing to visit the natural history museum. Can you tell me the best way to"
-inp = tokenizer(prompt, return_tensors="pt").to(device)
-res = model_q.generate(**inp, num_beams=1, min_new_tokens=1, max_new_tokens=512)
 predicted_text = tokenizer.decode(res[0])
 print(predicted_text)

 import torch
 model_id = "LnL-AI/Yi-6B-gptq-4bit"
 device = torch.device("cuda:0")
+model = AutoGPTQForCausalLM.from_quantized(model_id, use_safetensors=True, device=device)
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 prompt = "I am in Shanghai, preparing to visit the natural history museum. Can you tell me the best way to"
+inputs = tokenizer(prompt, return_tensors="pt").to(device)
+res = model.generate(**inputs, num_beams=1, min_new_tokens=1, max_new_tokens=512)
 predicted_text = tokenizer.decode(res[0])
 print(predicted_text)