vlad-m-dev commited on
Commit
47a0852
·
verified ·
1 Parent(s): eda907f

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +87 -16
README.md CHANGED
@@ -1,21 +1,92 @@
1
  ---
2
  license: mit
3
  datasets:
4
- - alfredplpl/Japanese-photos
5
- - 3sara/colpali_italian_documents
6
  pipeline_tag: image-classification
7
  tags:
8
- - classification
9
- - mobile
10
- - tablet
11
- - quant
12
- - document
13
- - photos
14
- - images
15
- - q8
16
- - mobilenetv2
17
- - mobilenet_v2
18
- - mobilenetv2_onnx
19
- - onnx
20
- - mobilenet_v2_onnx
21
- ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
  license: mit
3
  datasets:
4
+ - alfredplpl/Japanese-photos
5
+ - 3sara/colpali_italian_documents
6
  pipeline_tag: image-classification
7
  tags:
8
+ - image-classification
9
+ - mobile
10
+ - tablet
11
+ - quantization
12
+ - onnx
13
+ - mobilenetv2
14
+ - mobilenet_v2
15
+ - mobilenetv2_onnx
16
+ - document-classification
17
+ - photo-classification
18
+ - real-time
19
+ - lightweight
20
+ - efficient
21
+ - document
22
+ - photo
23
+ - images
24
+ - q8
25
+ - int8
26
+ - edge-ai
27
+ - ai-on-device
28
+ - offline
29
+ - privacy
30
+ - fast
31
+ ---
32
+
33
+ # MobileNetV2 — ONNX, Quantized
34
+
35
+ ### 🔥 Класична мобільна модель для **класифікації зображень** на дві категорії:
36
+ - **`document`** (документи: скани, чеки, папери)
37
+ - **`photo`** (звичайні фотографії з телефона, сцени, люди, природа)
38
+
39
+ ---
40
+
41
+ ## 🟢 Основне
42
+
43
+ - **Модель створена спеціально для мобільних пристроїв** (телефонів і планшетів, Android/iOS), ідеальна для real-time inference прямо на пристрої!
44
+ - Архітектура: **MobileNetV2**
45
+ - Формат: **ONNX** (є float32 та квантизована int8 версія)
46
+ - Навчалась на збалансованих open-source датасетах з реальними документами та фото.
47
+ - Підходить для задач:
48
+ - Детекція документів у галереї
49
+ - Класифікація скріншотів, чеків, фото, pdf preview і т.д.
50
+ - Сортування зображень для приватних AI-асистентів, офлайн-класифікація
51
+
52
+ ---
53
+
54
+ ## 🏷️ Класи моделі
55
+ - **0** — `document`
56
+ - **1** — `photo`
57
+
58
+ ---
59
+
60
+ ## ⚡️ Версії
61
+
62
+ - `mobilenetv2_doc_photo.onnx` — звичайна float32, максимальна точність, ідеально для AI на ARM/CPU
63
+ - `mobilenetv2_doc_photo_quant.onnx` — квантизована int8, ще швидше, ще менше (ідеально для low-power девайсів!)
64
+
65
+ ---
66
+
67
+ ## 🚀 Чому ця модель?
68
+
69
+ - **Мала вага** швидкість inference <100ms на середньому телефоні
70
+ - **Працює офлайн** (privacy, без REST-запитів!)
71
+ - **Легко інтегрується** у будь-який фреймворк, включаючи React Native (`onnxruntime-react-native`), Android (ONNX Runtime), iOS.
72
+
73
+ ---
74
+
75
+ ## 🗃️ Датасети
76
+
77
+ - **Фото**: [alfredplpl/Japanese-photos](https://huggingface.co/datasets/alfredplpl/Japanese-photos)
78
+ - **Документи**: [3sara/colpali_italian_documents](https://huggingface.co/datasets/3sara/colpali_italian_documents)
79
+
80
+ ---
81
+
82
+ ## 🛠️ Як використати
83
+
84
+ ```python
85
+ import onnxruntime as ort
86
+ import numpy as np
87
+
88
+ session = ort.InferenceSession("mobilenetv2_doc_photo_quant.onnx")
89
+ img = np.random.randn(1, 3, 224, 224).astype(np.float32) # Сюди своє зображення!
90
+ output = session.run(None, {"input": img})
91
+ pred_class = np.argmax(output[0])
92
+ print(pred_class) # 0 — document, 1 — photo