jwnder
/

core42_jais-13b-chat-bnb-4bit

Text Generation

4-bit precision

Model card Files Files and versions Community

jwnder commited on Apr 7, 2024

Commit

74ade01

·

verified ·

1 Parent(s): 998a974

Update README.md

Files changed (1) hide show

README.md +2 -14

README.md CHANGED Viewed

@@ -25,20 +25,8 @@ model_name = "jwnder/core42_jais-13b-chat-bnb-4bit"
 import warnings
 warnings.filterwarnings('ignore')
-bnb_config = BitsAndBytesConfig(
-    load_in_4bit=True,
-    bnb_4bit_quant_type="nf4",
-    bnb_4bit_compute_dtype=torch.bfloat16,
-    bnb_4bit_use_double_quant=True,
-    llm_int8_enable_fp32_cpu_offload=True
-)
-tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
-model = AutoModelForCausalLM.from_pretrained(
-    model_name,
-    quantization_config=bnb_config,
-    device_map="auto",
-    trust_remote_code=True
-)
 inputs = tokenizer("Testing LLM!", return_tensors="pt")
 start = datetime.now()

 import warnings
 warnings.filterwarnings('ignore')
+tokenizer = AutoTokenizer.from_pretrained(model_input_folder, trust_remote_code=True)
+model = AutoModelForCausalLM.from_pretrained(model_input_folder, trust_remote_code=True)
 inputs = tokenizer("Testing LLM!", return_tensors="pt")
 start = datetime.now()