rest

Sleeping

tahsinhasem commited on Apr 15

Commit

8d5fa35

verified ·

1 Parent(s): d236bfb

Update main.py

Files changed (1) hide show

main.py CHANGED Viewed

@@ -19,11 +19,17 @@ model = AutoModelForCausalLM.from_pretrained(
 # Example usage: Generate text
 prompt = "The quick brown fox"
-input_ids = tokenizer.encode(prompt, return_tensors="pt")
-output = model.generate(input_ids, max_length=50, num_return_sequences=1)
-generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
-print(generated_text)
 app = FastAPI()
@@ -53,7 +59,7 @@ async def generate_text(item: Item):
     # logging.info("Response generated")
-    inputs = tokenizer(prompt, return_tensors="pt", padding=True, return_attention_mask=True, ).to(model.device)
     # input_ids = tokenizer.encode(item.prompt, return_tensors="pt")

 # Example usage: Generate text
 prompt = "The quick brown fox"
+inputs = tokenizer(prompt, return_tensors="pt", padding=True, return_attention_mask=True, ).to(model.device)
+outputs = model.generate(
+    **inputs,
+    max_new_tokens=100,
+    pad_token_id=tokenizer.eos_token_id  # Set this to suppress warning
+)
+resp = tokenizer.decode(outputs[0], skip_special_tokens=True)
+print(resp)
 app = FastAPI()
     # logging.info("Response generated")
+    inputs = tokenizer(item.prompt, return_tensors="pt", padding=True, return_attention_mask=True, ).to(model.device)
     # input_ids = tokenizer.encode(item.prompt, return_tensors="pt")