MoviesSemanticSearchTesting

Paused

App Files Files Community

opex792 commited on Jan 7

Commit

bbf6f5b

verified ·

1 Parent(s): 53feba3

Update app.py

Browse files

Files changed (1) hide show

app.py +17 -14

app.py CHANGED Viewed

@@ -1,10 +1,9 @@
 import gradio as gr
-from sentence_transformers import SentenceTransformer, util
 import os
 import time
 import threading
 import queue
-import torch
 import psycopg2
 import zlib
 import numpy as np
@@ -152,18 +151,20 @@ def get_movies_without_embeddings():
             # Получаем список всех фильмов из таблицы Movies с подготовленной строкой
             cur.execute(f"""
                 SELECT id, data,
-                    'Название: ' || data->>'name' ||
-                    '\\nГод: ' || data->>'year' ||
-                    '\\nЖанры: ' || (SELECT string_agg(genre->>'name', ', ') FROM jsonb_array_elements(data->'genres') AS genre) ||
-                    '\\nОписание: ' || COALESCE(data->>'description', '')
-                    AS prepared_string
                 FROM "{movies_table}"
             """)
             all_movies = cur.fetchall()
             # Фильтруем только те фильмы, которых нет в таблице эмбеддингов
-            for movie_id, movie_data, prepared_string in all_movies:
                 if movie_id not in existing_ids:
                     movies_to_process.append((movie_id, movie_data, prepared_string))
         logging.info(f"Найдено {len(movies_to_process)} фильмов для обработки.")
@@ -286,15 +287,17 @@ def get_movie_data_from_db(conn, movie_ids):
         with conn.cursor() as cur:
             cur.execute(f"""
                 SELECT id, data,
-                    'Название: ' || data->>'name' ||
-                    '\\nГод: ' || data->>'year' ||
-                    '\\nЖанры: ' || (SELECT string_agg(genre->>'name', ', ') FROM jsonb_array_elements(data->'genres') AS genre) ||
-                    '\\nОписание: ' || COALESCE(data->>'description', '')
-                    AS prepared_string
                 FROM "{movies_table}"
                 WHERE id IN %s
             """, (tuple(movie_ids),))
-            for movie_id, movie_data, prepared_string in cur.fetchall():
                 movie_data_dict[movie_id] = (movie_data, prepared_string)
     except Exception as e:
         logging.error(f"Ошибка при получении данных фильмов из БД: {e}")

 import gradio as gr
+from sentence_transformers import SentenceTransformer
 import os
 import time
 import threading
 import queue
 import psycopg2
 import zlib
 import numpy as np
             # Получаем список всех фильмов из таблицы Movies с подготовленной строкой
             cur.execute(f"""
                 SELECT id, data,
+                    jsonb_build_object(
+                        'Название', data->>'name',
+                        'Год', data->>'year',
+                        'Жанры', (SELECT string_agg(genre->>'name', ', ') FROM jsonb_array_elements(data->'genres') AS genre),
+                        'Описание', COALESCE(data->>'description', '')
+                    ) AS prepared_json
                 FROM "{movies_table}"
             """)
             all_movies = cur.fetchall()
             # Фильтруем только те фильмы, которых нет в таблице эмбеддингов
+            for movie_id, movie_data, prepared_json in all_movies:
                 if movie_id not in existing_ids:
+                    prepared_string = f"Название: {prepared_json['Название']}\nГод: {prepared_json['Год']}\nЖанры: {prepared_json['Жанры']}\nОписание: {prepared_json['Описание']}"
                     movies_to_process.append((movie_id, movie_data, prepared_string))
         logging.info(f"Найдено {len(movies_to_process)} фильмов для обработки.")
         with conn.cursor() as cur:
             cur.execute(f"""
                 SELECT id, data,
+                    jsonb_build_object(
+                        'Название', data->>'name',
+                        'Год', data->>'year',
+                        'Жанры', (SELECT string_agg(genre->>'name', ', ') FROM jsonb_array_elements(data->'genres') AS genre),
+                        'Описание', COALESCE(data->>'description', '')
+                    ) AS prepared_json
                 FROM "{movies_table}"
                 WHERE id IN %s
             """, (tuple(movie_ids),))
+            for movie_id, movie_data, prepared_json in cur.fetchall():
+                prepared_string = f"Название: {prepared_json['Название']}\nГод: {prepared_json['Год']}\nЖанры: {prepared_json['Жанры']}\nОписание: {prepared_json['Описание']}"
                 movie_data_dict[movie_id] = (movie_data, prepared_string)
     except Exception as e:
         logging.error(f"Ошибка при получении данных фильмов из БД: {e}")