Spaces:

gauri-sharan
/

rag-advanced-2

Runtime error

App Files Files Community

gauri-sharan commited on May 25

Commit

8a4fa5e

verified ·

1 Parent(s): 7abd8f0

Update app.py

Browse files

Files changed (1) hide show

app.py +22 -25

app.py CHANGED Viewed

@@ -1,6 +1,5 @@
 import os
 import tempfile
-import torch
 import gradio as gr
 import spaces  # Required for GPU-enabled Spaces
@@ -12,40 +11,32 @@ from langchain.chains import RetrievalQAWithSourcesChain
 from langchain_text_splitters import RecursiveCharacterTextSplitter
 from langchain.embeddings import HuggingFaceEmbeddings
-# Set device for embeddings
-device = "cuda" if torch.cuda.is_available() else "cpu"
-# Initialize Pinecone
 pc = Pinecone(api_key=os.getenv("PINECONE_API_KEY"))
 INDEX_NAME = "ragreader"
-# GPU-decorated function to load HuggingFace embeddings on GPU
 @spaces.GPU
-def init_embeddings():
-    return HuggingFaceEmbeddings(
         model_name="BAAI/bge-large-en-v1.5",
         model_kwargs={"device": device}
     )
-embeddings = init_embeddings()
-# GPU-decorated document processing function
-@spaces.GPU
-def process_documents(files):
     docs = []
     for file in files:
-        with tempfile.NamedTemporaryFile(delete=False) as tmp:
             tmp.write(file.read())
             loader = PyPDFLoader(tmp.name)
             docs.extend(loader.load())
         os.unlink(tmp.name)
     text_splitter = RecursiveCharacterTextSplitter(
         chunk_size=1000,
         chunk_overlap=200
     )
     split_docs = text_splitter.split_documents(docs)
     PineconeVectorStore.from_documents(
         documents=split_docs,
         embedding=embeddings,
@@ -53,19 +44,20 @@ def process_documents(files):
     )
     return "Documents processed and stored."
-# Initialize the RetrievalQA chain (no GPU decoration needed here)
 def init_qa_chain():
     llm = ChatMistralAI(
         model="mistral-tiny",
         temperature=0.3,
         mistral_api_key=os.getenv("MISTRAL_API_KEY")
     )
     vector_store = PineconeVectorStore(
         index_name=INDEX_NAME,
-        embedding=embeddings
     )
     return RetrievalQAWithSourcesChain.from_chain_type(
         llm=llm,
         chain_type="stuff",
@@ -73,13 +65,13 @@ def init_qa_chain():
         return_source_documents=True
     )
 qa_chain = None
-# Build the Gradio UI
 with gr.Blocks() as demo:
     gr.Markdown("## RAG Chatbot - PDF Reader")
-    file_input = gr.File(file_types=[".pdf"], file_count="multiple", label="Upload PDFs")
     process_btn = gr.Button("Process Documents")
     process_output = gr.Textbox(label="Processing Status")
@@ -90,21 +82,26 @@ with gr.Blocks() as demo:
     def process_wrapper(files):
         global qa_chain
         msg = process_documents(files)
         qa_chain = init_qa_chain()
         return msg
     def chat_with_docs(question):
         if not qa_chain:
             return "Please upload and process documents first.", ""
         response = qa_chain.invoke({"question": question}, return_only_outputs=True)
         sources = "\n".join(
             f"{os.path.basename(doc.metadata.get('source', 'unknown'))} (Page {doc.metadata.get('page', 'N/A')})"
             for doc in response.get('source_documents', [])[:3]
         )
-        return response['answer'], sources
-    process_btn.click(fn=process_wrapper, inputs=file_input, outputs=process_output)
     chat_btn.click(fn=chat_with_docs, inputs=chat_input, outputs=[chat_output, source_output])
 if __name__ == "__main__":

 import os
 import tempfile
 import gradio as gr
 import spaces  # Required for GPU-enabled Spaces
 from langchain_text_splitters import RecursiveCharacterTextSplitter
 from langchain.embeddings import HuggingFaceEmbeddings
+# Initialize Pinecone (safe, does not use CUDA)
 pc = Pinecone(api_key=os.getenv("PINECONE_API_KEY"))
 INDEX_NAME = "ragreader"
+# This function does all GPU work: embedding creation, document processing, and vector store population
 @spaces.GPU
+def process_documents(files):
+    device = "cuda" if hasattr(__import__('torch'), 'cuda') and __import__('torch').cuda.is_available() else "cpu"
+    embeddings = HuggingFaceEmbeddings(
         model_name="BAAI/bge-large-en-v1.5",
         model_kwargs={"device": device}
     )
     docs = []
     for file in files:
+        with tempfile.NamedTemporaryFile(delete=False, suffix=".pdf") as tmp:
+            file.seek(0)
             tmp.write(file.read())
+            tmp.flush()
             loader = PyPDFLoader(tmp.name)
             docs.extend(loader.load())
         os.unlink(tmp.name)
     text_splitter = RecursiveCharacterTextSplitter(
         chunk_size=1000,
         chunk_overlap=200
     )
     split_docs = text_splitter.split_documents(docs)
     PineconeVectorStore.from_documents(
         documents=split_docs,
         embedding=embeddings,
     )
     return "Documents processed and stored."
+# This function creates the QA chain (CPU only)
 def init_qa_chain():
+    # Embeddings must be created inside a GPU function, so we do not re-create here.
+    # PineconeVectorStore uses the embeddings stored in Pinecone.
     llm = ChatMistralAI(
         model="mistral-tiny",
         temperature=0.3,
         mistral_api_key=os.getenv("MISTRAL_API_KEY")
     )
+    # Pass None for embeddings since vectors are already in Pinecone
     vector_store = PineconeVectorStore(
         index_name=INDEX_NAME,
+        embedding=None
     )
     return RetrievalQAWithSourcesChain.from_chain_type(
         llm=llm,
         chain_type="stuff",
         return_source_documents=True
     )
+# State: store the QA chain after processing
 qa_chain = None
 with gr.Blocks() as demo:
     gr.Markdown("## RAG Chatbot - PDF Reader")
+    file_input = gr.File(file_types=[".pdf"], file_count="multiple", type="file", label="Upload PDFs")
     process_btn = gr.Button("Process Documents")
     process_output = gr.Textbox(label="Processing Status")
     def process_wrapper(files):
         global qa_chain
+        if not files or len(files) == 0:
+            return "Please upload at least one PDF."
         msg = process_documents(files)
         qa_chain = init_qa_chain()
         return msg
     def chat_with_docs(question):
+        global qa_chain
         if not qa_chain:
             return "Please upload and process documents first.", ""
+        if not question.strip():
+            return "Please enter a question.", ""
         response = qa_chain.invoke({"question": question}, return_only_outputs=True)
         sources = "\n".join(
             f"{os.path.basename(doc.metadata.get('source', 'unknown'))} (Page {doc.metadata.get('page', 'N/A')})"
             for doc in response.get('source_documents', [])[:3]
         )
+        return response.get('answer', "No answer found."), sources
+    process_btn.click(fn=process_wrapper, inputs=[file_input], outputs=process_output)
     chat_btn.click(fn=chat_with_docs, inputs=chat_input, outputs=[chat_output, source_output])
 if __name__ == "__main__":