vlad-m-dev
/

mobilenetv2_doc_photo_quant

Model card Files Files and versions

xet

Community

vlad-m-dev commited on Jun 15

Commit

47a0852

verified ·

1 Parent(s): eda907f

Update README.md

Browse files

Files changed (1) hide show

README.md +87 -16

README.md CHANGED Viewed

@@ -1,21 +1,92 @@
 ---
 license: mit
 datasets:
-- alfredplpl/Japanese-photos
-- 3sara/colpali_italian_documents
 pipeline_tag: image-classification
 tags:
-- classification
-- mobile
-- tablet
-- quant
-- document
-- photos
-- images
-- q8
-- mobilenetv2
-- mobilenet_v2
-- mobilenetv2_onnx
-- onnx
-- mobilenet_v2_onnx
----

 ---
 license: mit
 datasets:
+  - alfredplpl/Japanese-photos
+  - 3sara/colpali_italian_documents
 pipeline_tag: image-classification
 tags:
+  - image-classification
+  - mobile
+  - tablet
+  - quantization
+  - onnx
+  - mobilenetv2
+  - mobilenet_v2
+  - mobilenetv2_onnx
+  - document-classification
+  - photo-classification
+  - real-time
+  - lightweight
+  - efficient
+  - document
+  - photo
+  - images
+  - q8
+  - int8
+  - edge-ai
+  - ai-on-device
+  - offline
+  - privacy
+  - fast
+---
+# MobileNetV2 — ONNX, Quantized
+### 🔥 Класична мобільна модель для **класифікації зображень** на дві категорії:
+- **`document`** (документи: скани, чеки, папери)
+- **`photo`** (звичайні фотографії з телефона, сцени, люди, природа)
+---
+## 🟢 Основне
+- **Модель створена спеціально для мобільних пристроїв** (телефонів і планшетів, Android/iOS), ідеальна для real-time inference прямо на пристрої!
+- Архітектура: **MobileNetV2**
+- Формат: **ONNX** (є float32 та квантизована int8 версія)
+- Навчалась на збалансованих open-source датасетах з реальними документами та фото.
+- Підходить для задач:
+  - Детекція документів у галереї
+  - Класифікація скріншотів, чеків, фото, pdf preview і т.д.
+  - Сортування зображень для приватних AI-асистентів, офлайн-класифікація
+---
+## 🏷️ Класи моделі
+- **0** — `document`
+- **1** — `photo`
+---
+## ⚡️ Версії
+- `mobilenetv2_doc_photo.onnx` — звичайна float32, максимальна точність, ідеально для AI на ARM/CPU
+- `mobilenetv2_doc_photo_quant.onnx` — квантизована int8, ще швидше, ще менше (ідеально для low-power девайсів!)
+---
+## 🚀 Чому ця модель?
+- **Мала вага** швидкість inference <100ms на середньому телефоні
+- **Працює офлайн** (privacy, без REST-запитів!)
+- **Легко інтегрується** у будь-який фреймворк, включаючи React Native (`onnxruntime-react-native`), Android (ONNX Runtime), iOS.
+---
+## 🗃️ Датасети
+- **Фото**: [alfredplpl/Japanese-photos](https://huggingface.co/datasets/alfredplpl/Japanese-photos)
+- **Документи**: [3sara/colpali_italian_documents](https://huggingface.co/datasets/3sara/colpali_italian_documents)
+---
+## 🛠️ Як використати
+```python
+import onnxruntime as ort
+import numpy as np
+session = ort.InferenceSession("mobilenetv2_doc_photo_quant.onnx")
+img = np.random.randn(1, 3, 224, 224).astype(np.float32)  # Сюди своє зображення!
+output = session.run(None, {"input": img})
+pred_class = np.argmax(output[0])
+print(pred_class)  # 0 — document, 1 — photo