Spaces:

0edon
/

test

Paused

Quintino Fernandes commited on May 7

Commit

a988661

1 Parent(s): fce85f3

Same similarity problem

Files changed (2) hide show

database/query_processor.py CHANGED Viewed

@@ -118,7 +118,7 @@ class QueryProcessor:
             print("Starting first summary generation")
             embeddings = self.embedding_model.encode(sentences)
             print("Embeddings generated first summary")
-            similarity_matrix = self.embedding_model.similarity(embeddings, embeddings).numpy
             centrality_scores = degree_centrality_scores(similarity_matrix, threshold=None)
             top_indices = np.argsort(-centrality_scores)[:10]

             print("Starting first summary generation")
             embeddings = self.embedding_model.encode(sentences)
             print("Embeddings generated first summary")
+            similarity_matrix = np.dot(embeddings, embeddings.T) / (np.linalg.norm(embeddings, axis=1, keepdims=True) * np.linalg.norm(embeddings, axis=1, keepdims=True).T)
             centrality_scores = degree_centrality_scores(similarity_matrix, threshold=None)
             top_indices = np.argsort(-centrality_scores)[:10]

models/embedding.py CHANGED Viewed

@@ -7,7 +7,4 @@ class EmbeddingModel:
         self.model = SentenceTransformer("paraphrase-multilingual-MiniLM-L12-v2")
     def encode(self, text: str):
-        return self.model.encode(text, device=self.device)
-    def similarity(self, embeddings):
-        return self.model.similarity(embeddings, embeddings)

         self.model = SentenceTransformer("paraphrase-multilingual-MiniLM-L12-v2")
     def encode(self, text: str):
+        return self.model.encode(text, device=self.device)