Spaces:

Thermostatic
/

Llama-3-NeuralTranslate-Instructions-70B-v0.1

Runtime error

Thermostatic commited on May 18

Commit

359241c

•

1 Parent(s): c86bf33

Fixed gated model problem

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,18 +1,19 @@
 import gradio as gr
 from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
 import spaces
 # Set the model and tokenizer
 model_name = "meta-llama/Meta-Llama-3-70B-Instruct"
 lora_name = "Thermostatic/Llama-3-NeuralTranslate-Instructions-70b-v0.1-lora"
-model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 lora_adapter = model.load_adapter(lora_name, with_head=False)
 model.to('cuda')
 @spaces.GPU
 def translate(input_text):
-    input_ids = tokenizer.encode(f"Translate the following text from English to Spanish: {input_text}", return_tensors="pt")
     response = model.generate(input_ids, adapter_name=lora_name, max_length=1024)
     response_text = tokenizer.decode(response[0], skip_special_tokens=True)
     return f"Translated text: {response_text}"

 import gradio as gr
 from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
 import spaces
+import os
 # Set the model and tokenizer
 model_name = "meta-llama/Meta-Llama-3-70B-Instruct"
 lora_name = "Thermostatic/Llama-3-NeuralTranslate-Instructions-70b-v0.1-lora"
+model = AutoModelForSeq2SeqLM.from_pretrained(model_name, token=os.environ["HUGGINGFACE_TOKEN"])
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 lora_adapter = model.load_adapter(lora_name, with_head=False)
 model.to('cuda')
 @spaces.GPU
 def translate(input_text):
+    input_ids = tokenizer.encode(input_text, return_tensors="pt")
     response = model.generate(input_ids, adapter_name=lora_name, max_length=1024)
     response_text = tokenizer.decode(response[0], skip_special_tokens=True)
     return f"Translated text: {response_text}"