Update app.py
Browse files
app.py
CHANGED
@@ -31,27 +31,27 @@ def get_text_file(txt_docs):
|
|
31 |
temp_filepath = os.path.join(temp_dir.name, txt_docs.name)
|
32 |
with open(temp_filepath, "wb") as f:
|
33 |
f.write(txt_docs.getvalue())
|
34 |
-
|
35 |
-
|
36 |
-
|
37 |
|
38 |
def get_csv_file(csv_docs):
|
39 |
temp_dir = tempfile.TemporaryDirectory()
|
40 |
temp_filepath = os.path.join(temp_dir.name, csv_docs.name)
|
41 |
with open(temp_filepath, "wb") as f:
|
42 |
f.write(csv_docs.getvalue())
|
43 |
-
|
44 |
-
|
45 |
-
|
46 |
|
47 |
def get_json_file(json_docs):
|
48 |
temp_dir = tempfile.TemporaryDirectory()
|
49 |
temp_filepath = os.path.join(temp_dir.name, json_docs.name)
|
50 |
with open(temp_filepath, "wb") as f:
|
51 |
f.write(json_docs.getvalue())
|
52 |
-
|
53 |
-
|
54 |
-
|
55 |
|
56 |
|
57 |
# 문서들을 처리하여 텍스트 청크로 나누는 함수입니다.
|
|
|
31 |
temp_filepath = os.path.join(temp_dir.name, txt_docs.name)
|
32 |
with open(temp_filepath, "wb") as f:
|
33 |
f.write(txt_docs.getvalue())
|
34 |
+
txt_loader = TextLoader(temp_filepath) # PyPDFLoader를 사용해 PDF를 로드합니다.
|
35 |
+
txt_doc = txt_loader.load() # 텍스트를 추출합니다.
|
36 |
+
return txt_doc
|
37 |
|
38 |
def get_csv_file(csv_docs):
|
39 |
temp_dir = tempfile.TemporaryDirectory()
|
40 |
temp_filepath = os.path.join(temp_dir.name, csv_docs.name)
|
41 |
with open(temp_filepath, "wb") as f:
|
42 |
f.write(csv_docs.getvalue())
|
43 |
+
csv_loader = CSVLoader(temp_filepath) # CSVLoader를 사용해 PDF를 로드합니다.
|
44 |
+
csv_doc = csv_loader.load() # 텍스트를 추출합니다.
|
45 |
+
return csv_doc
|
46 |
|
47 |
def get_json_file(json_docs):
|
48 |
temp_dir = tempfile.TemporaryDirectory()
|
49 |
temp_filepath = os.path.join(temp_dir.name, json_docs.name)
|
50 |
with open(temp_filepath, "wb") as f:
|
51 |
f.write(json_docs.getvalue())
|
52 |
+
json_loader = JSONLLoader(temp_filepath) # JSONLoader를 사용해 PDF를 로드합니다.
|
53 |
+
json_doc = json_loader.load() # 텍스트를 추출합니다.
|
54 |
+
return json_doc
|
55 |
|
56 |
|
57 |
# 문서들을 처리하여 텍스트 청크로 나누는 함수입니다.
|