Spaces:

NaserNajeh
/

Horoof-Hybrid-OCR

Runtime error

App Files Files Community

NaserNajeh commited on Sep 5

Commit

95c55af

verified ·

1 Parent(s): 7d26757

Update app.py

Browse files

Files changed (1) hide show

app.py +73 -53

app.py CHANGED Viewed

@@ -3,6 +3,7 @@ import gradio as gr
 import fitz  # PyMuPDF
 from PIL import Image
 import numpy as np
 # =======================
 # 1) EasyOCR (CPU - مجاني)
@@ -25,58 +26,83 @@ def ocr_easyocr(pil_img: Image.Image) -> str:
 # ===============================================
 # 2) Inference API (يستهلك اعتمادات PRO بدل دقائق GPU)
-#    نستخدم TrOCR عربي عبر image_to_text فقط
 # ===============================================
-from huggingface_hub import InferenceClient
-_INFER_CLIENT = None
-# يمكنك تغييره من Settings → Variables بوضع INFER_MODEL، الافتراضي أدناه TrOCR عربي:
 INFER_MODEL = os.environ.get("INFER_MODEL", "David-Magdy/TR_OCR_LARGE")
-def get_infer_client():
-    """تهيئة عميل الاستدلال مع مهلة أطول ورسالة واضحة إن غاب التوكين."""
-    global _INFER_CLIENT
-    if _INFER_CLIENT is None:
-        token = os.environ.get("HF_TOKEN")
-        if not token:
-            raise RuntimeError("لا يوجد HF_TOKEN في Secrets. أضِفه من Settings → Variables and secrets.")
-        _INFER_CLIENT = InferenceClient(model=INFER_MODEL, token=token, timeout=120)
-    return _INFER_CLIENT
 def ocr_infer_api(pil_img: Image.Image) -> str:
     """
-    استدعاء Inference API لنموذج OCR عربي (TrOCR) عبر image_to_text فقط،
-    مع معالجة حالة التحميل/المهلة بإعادة محاولة واحدة.
     """
     try:
-        client = get_infer_client()
-        # حضّر الصورة كـ BytesIO
-        buf = io.BytesIO()
-        pil_img.save(buf, format="PNG")
-        buf.seek(0)
-        # المحاولة الأولى
-        try:
-            out = client.image_to_text(image=buf)
-            txt = (out or "").strip()
-            if txt:
-                return txt
-        except Exception as e1:
-            last = repr(e1)
-        # إعادة المحاولة (أحيانًا الموديل يكون في حالة "loading")
-        time.sleep(3)
-        buf.seek(0)
-        try:
-            out = client.image_to_text(image=buf)
-            txt = (out or "").strip()
-            if txt:
-                return txt
-        except Exception as e2:
-            last = repr(e2)
-        return f"حدث خطأ أثناء استدعاء Inference API (image_to_text): {last}"
     except Exception as e:
         return f"حدث خطأ أثناء استدعاء Inference API: {repr(e)}"
@@ -168,13 +194,14 @@ def ocr_pdf(pdf_file, dpi, limit_pages, backend):
 # زر تشخيص Inference API
 # =======================
 def diag_infer():
-    import sys, requests, huggingface_hub
     info = []
     token = os.environ.get("HF_TOKEN")
     info.append(f"HF_TOKEN: {'موجود' if token else 'مفقود'}")
     info.append(f"INFER_MODEL: {INFER_MODEL}")
     info.append(f"huggingface_hub: {huggingface_hub.__version__}")
     info.append(f"Python: {sys.version.split()[0]}")
     try:
         r = requests.get(
             f"https://api-inference.huggingface.co/models/{INFER_MODEL}",
@@ -188,13 +215,6 @@ def diag_infer():
             info.append("Response is not JSON.")
     except Exception as e:
         info.append(f"HTTP check error: {repr(e)}")
-    try:
-        client = get_infer_client()
-        # ping بسيط (قد يفشل لبعض النماذج؛ الهدف اختبار المصادقة والاتصال)
-        _ = client.text_generation("ping", max_new_tokens=1)
-        info.append("basic text_generation ping: OK")
-    except Exception as e:
-        info.append(f"text_generation ping error: {repr(e)}")
     return "\n".join(str(x) for x in info)

 import fitz  # PyMuPDF
 from PIL import Image
 import numpy as np
+import requests
 # =======================
 # 1) EasyOCR (CPU - مجاني)
 # ===============================================
 # 2) Inference API (يستهلك اعتمادات PRO بدل دقائق GPU)
+#    نستخدم TrOCR عربي عبر نداء HTTP مباشر لمهمة image-to-text
 # ===============================================
+# الموديل الافتراضي (يمكن تغييره من Settings → Variables بوضع INFER_MODEL)
 INFER_MODEL = os.environ.get("INFER_MODEL", "David-Magdy/TR_OCR_LARGE")
 def ocr_infer_api(pil_img: Image.Image) -> str:
     """
+    استدعاء HF Inference API مباشرة على endpoint:
+      POST https://api-inference.huggingface.co/models/{INFER_MODEL}
+    مع تمرير الصورة كبايتات (image/png) وفق مهمة image-to-text.
+    نعيد المحاولة مرة واحدة إذا كانت الحالة 503 (loading).
     """
+    token = os.environ.get("HF_TOKEN")
+    if not token:
+        return "حدث خطأ أثناء استدعاء Inference API: لا يوجد HF_TOKEN في Secrets."
+    url = f"https://api-inference.huggingface.co/models/{INFER_MODEL}"
+    headers = {
+        "Authorization": f"Bearer {token}",
+        "Accept": "application/json",
+        # لا تحدد Content-Type كنص JSON؛ سنرسل الصورة خامًا:
+        # "Content-Type": "application/octet-stream"  # يُمكن تركه، Requests سيعيّنه تلقائيًا
+    }
+    # حضّر الصورة في BytesIO (PNG)
+    buf = io.BytesIO()
+    # توحيد الوضع إلى RGB لتجنّب مشاكل بعض النماذج
+    pil_img = pil_img.convert("RGB")
+    pil_img.save(buf, format="PNG")
+    img_bytes = buf.getvalue()
+    def call_once():
+        r = requests.post(url, headers=headers, data=img_bytes, timeout=120)
+        if r.status_code == 200:
+            # عادةً يرجع شكل مثل: [{"generated_text": "..."}]
+            try:
+                js = r.json()
+            except Exception:
+                # لو لم يكن JSON (نادرًا) نعيد النص كما هو
+                return r.text.strip()
+            if isinstance(js, list) and js and isinstance(js[0], dict):
+                txt = js[0].get("generated_text", "")
+                return (txt or "").strip()
+            elif isinstance(js, dict) and "generated_text" in js:
+                return (js.get("generated_text") or "").strip()
+            else:
+                # أحيانًا يرجع هيكل مختلف؛ نطبع ما تم إرجاعه
+                return str(js).strip()
+        elif r.status_code == 503:
+            # الموديل قيد التحميل
+            try:
+                js = r.json()
+                est = js.get("estimated_time", 5)
+            except Exception:
+                est = 5
+            return {"_retry_after": min(int(est) + 1, 10)}
+        else:
+            # خطأ واضح من الخادم
+            try:
+                js = r.json()
+                msg = js.get("error", r.text)
+            except Exception:
+                msg = r.text
+            raise RuntimeError(f"{r.status_code}: {msg}")
+    # المحاولة الأولى
     try:
+        out = call_once()
+        if isinstance(out, dict) and "_retry_after" in out:
+            time.sleep(out["_retry_after"])
+            out = call_once()
+        if isinstance(out, dict):
+            # لو بقي dict حتى الآن نعيده كنص
+            return f"حدث خطأ أثناء استدعاء Inference API: {out}"
+        return out if out else "لم يرجع الموديل أي نص."
     except Exception as e:
         return f"حدث خطأ أثناء استدعاء Inference API: {repr(e)}"
 # زر تشخيص Inference API
 # =======================
 def diag_infer():
+    import sys, huggingface_hub
     info = []
     token = os.environ.get("HF_TOKEN")
     info.append(f"HF_TOKEN: {'موجود' if token else 'مفقود'}")
     info.append(f"INFER_MODEL: {INFER_MODEL}")
     info.append(f"huggingface_hub: {huggingface_hub.__version__}")
     info.append(f"Python: {sys.version.split()[0]}")
+    # فحص حالة الموديل
     try:
         r = requests.get(
             f"https://api-inference.huggingface.co/models/{INFER_MODEL}",
             info.append("Response is not JSON.")
     except Exception as e:
         info.append(f"HTTP check error: {repr(e)}")
     return "\n".join(str(x) for x in info)