Spaces:

KRISH09bha
/

hackrx

Runtime error

KRISH09bha commited on Jul 29

Commit

42ac404

verified ·

1 Parent(s): 62b1d20

Update main.py

Files changed (1) hide show

main.py CHANGED Viewed

@@ -1,4 +1,4 @@
-import os
 import tempfile
 import requests
 from fastapi import FastAPI, HTTPException, Header, Request
@@ -14,10 +14,10 @@ from sentence_transformers import SentenceTransformer
 import faiss
 import numpy as np
 from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
 import os
 os.environ["HF_HOME"] = "./cache"
-# Load environment variables
 load_dotenv()
 HF_API_TOKEN = os.getenv("HF_API_TOKEN")
 API_KEY = os.getenv("API_KEY")
@@ -37,7 +37,12 @@ EMBED_MODEL = SentenceTransformer("all-MiniLM-L6-v2")
 model_name = "deepseek-ai/deepseek-llm-7b-base"
 hf_token = os.getenv("HF_API_TOKEN")  # Make sure your .env has HF_API_TOKEN
 tokenizer = AutoTokenizer.from_pretrained(model_name, token=hf_token)
-model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto", token=hf_token)
 pipe = pipeline("text-generation", model=model, tokenizer=tokenizer)
 def query_llm(question: str, context_chunks: list):

 import tempfile
 import requests
 from fastapi import FastAPI, HTTPException, Header, Request
 import faiss
 import numpy as np
 from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
+# Load environment variables
 import os
 os.environ["HF_HOME"] = "./cache"
 load_dotenv()
 HF_API_TOKEN = os.getenv("HF_API_TOKEN")
 API_KEY = os.getenv("API_KEY")
 model_name = "deepseek-ai/deepseek-llm-7b-base"
 hf_token = os.getenv("HF_API_TOKEN")  # Make sure your .env has HF_API_TOKEN
 tokenizer = AutoTokenizer.from_pretrained(model_name, token=hf_token)
+model = AutoModelForCausalLM.from_pretrained(
+    model_name,
+    device_map="auto",
+    token=hf_token,
+    offload_folder="./cache/offload"
+)
 pipe = pipeline("text-generation", model=model, tokenizer=tokenizer)
 def query_llm(question: str, context_chunks: list):