Spaces:

ziem-io
/

whisky-wheel

Sleeping

App Files Files

ziem-io commited on Sep 21

Commit

9ea7979

1 Parent(s): a8b9f74

New: Add lang check

Browse files

Files changed (1) hide show

app.py +37 -6

app.py CHANGED Viewed

@@ -1,6 +1,8 @@
 import gradio as gr
 import fasttext
 import html
 from huggingface_hub import hf_hub_download
 # Projektspezifische Module
@@ -23,17 +25,44 @@ lid_path = hf_hub_download(
 lid_model = fasttext.load_model(lid_path)
-### Do actual prediction ##############################################
-def predict(review: str, mode: str):
-    review = (review or "").strip()
-    # Check language of review
     lang_labels, lang_probs = lid_model.predict(review)
     lang_label = lang_labels[0]
     lang_prob = float(lang_probs[0])
     if not review:
         # immer zwei Outputs zurückgeben
         return "<i>Please enter a review.</i>", {}
@@ -47,8 +76,10 @@ def predict(review: str, mode: str):
         json_out = {
             "review": review,
             "mode": mode,
-            "lang_label": lang_label,
-            "lang_prob": lang_prob
         }
         return html_out, json_out

 import gradio as gr
 import fasttext
 import html
+import numpy as np
+import types
 from huggingface_hub import hf_hub_download
 # Projektspezifische Module
 lid_model = fasttext.load_model(lid_path)
+# robustes predict mit NumPy-2-Fix + Fallback, falls fastText nur Labels liefert
+def _predict_np2_compat(self, text, k=1, threshold=0.0, on_unicode_error='strict'):
+    out = self.f.predict(text, k, threshold, on_unicode_error)
+    # Fälle:
+    # 1) (labels, probs)
+    # 2) labels-only (einige Builds/SWIG-Versionen)
+    if isinstance(out, tuple) and len(out) == 2:
+        labels, probs = out
+    else:
+        labels = out
+        # sinnvolle Defaults, falls keine Wahrscheinlichkeiten vorliegen
+        if isinstance(labels, (list, tuple)):
+            probs = [1.0] * len(labels)
+        else:
+            labels = [labels]
+            probs = [1.0]
+    return labels, np.asarray(probs)  # np.asarray statt np.array(copy=False)
+# Instanz patchen
+lid_model.predict = types.MethodType(_predict_np2_compat, lid_model)
+### Check if lang is english ##############################################
+def is_eng(review: str):
     lang_labels, lang_probs = lid_model.predict(review)
     lang_label = lang_labels[0]
     lang_prob = float(lang_probs[0])
+    return lang_label[1] == "__lang_en__", lang_prob
+### Do actual prediction ##############################################
+def predict(review: str, mode: str):
+    review = (review or "").strip()
+    review_is_eng, review_is_eng_prob = is_eng(review)
     if not review:
         # immer zwei Outputs zurückgeben
         return "<i>Please enter a review.</i>", {}
         json_out = {
             "review": review,
             "mode": mode,
+            "is_en": {
+                "is": review_is_eng,
+                "prob": review_is_eng_prob
+            }
         }
         return html_out, json_out