Spaces:

gauri-sharan
/

rag-advanced-2

Runtime error

gauri-sharan commited on May 25

Commit

f4736cc

verified ·

1 Parent(s): 8cbe701

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,12 +2,7 @@ import os
 import tempfile
 import torch
 import gradio as gr
-# Patch torch if needed
-if not hasattr(torch, "get_default_device"):
-    def get_default_device():
-        return torch.device("cuda" if torch.cuda.is_available() else "cpu")
-    torch.get_default_device = get_default_device
 from pinecone import Pinecone
 from langchain_pinecone import PineconeVectorStore
@@ -17,21 +12,25 @@ from langchain.chains import RetrievalQAWithSourcesChain
 from langchain_text_splitters import RecursiveCharacterTextSplitter
 from langchain.embeddings import HuggingFaceEmbeddings
-# Set device
 device = "cuda" if torch.cuda.is_available() else "cpu"
 # Initialize Pinecone
 pc = Pinecone(api_key=os.getenv("PINECONE_API_KEY"))
 INDEX_NAME = "ragreader"
-# Embedding initialization
-embeddings = HuggingFaceEmbeddings(
-    model_name="BAAI/bge-large-en-v1.5",
-    model_kwargs={'device': device}
-)
-# Document processing pipeline
 def process_documents(files):
     docs = []
     for file in files:
@@ -54,7 +53,7 @@ def process_documents(files):
     )
     return "Documents processed and stored."
-# Initialize QA chain
 def init_qa_chain():
     llm = ChatMistralAI(
         model="mistral-tiny",
@@ -76,7 +75,7 @@ def init_qa_chain():
 qa_chain = None
-# Gradio interface
 with gr.Blocks() as demo:
     gr.Markdown("## RAG Chatbot - PDF Reader")

 import tempfile
 import torch
 import gradio as gr
+import spaces  # Required for GPU-enabled Spaces
 from pinecone import Pinecone
 from langchain_pinecone import PineconeVectorStore
 from langchain_text_splitters import RecursiveCharacterTextSplitter
 from langchain.embeddings import HuggingFaceEmbeddings
+# Set device for embeddings
 device = "cuda" if torch.cuda.is_available() else "cpu"
 # Initialize Pinecone
 pc = Pinecone(api_key=os.getenv("PINECONE_API_KEY"))
 INDEX_NAME = "ragreader"
+# GPU-decorated function to load HuggingFace embeddings on GPU
+@spaces.GPU
+def init_embeddings():
+    return HuggingFaceEmbeddings(
+        model_name="BAAI/bge-large-en-v1.5",
+        model_kwargs={"device": device}
+    )
+embeddings = init_embeddings()
+# GPU-decorated document processing function
+@spaces.GPU
 def process_documents(files):
     docs = []
     for file in files:
     )
     return "Documents processed and stored."
+# Initialize the RetrievalQA chain (no GPU decoration needed here)
 def init_qa_chain():
     llm = ChatMistralAI(
         model="mistral-tiny",
 qa_chain = None
+# Build the Gradio UI
 with gr.Blocks() as demo:
     gr.Markdown("## RAG Chatbot - PDF Reader")