|
--- |
|
license: mit |
|
language: |
|
- zh |
|
- en |
|
pipeline_tag: image-classification |
|
tags: |
|
- image-classification |
|
- binary-classification |
|
- mobilenetv3 |
|
- pytorch |
|
- acg |
|
- anime |
|
- comic |
|
- game |
|
- computer-vision |
|
|
|
--- |
|
|
|
# IsACG – “是否是 ACG 图像”的二分类模型系列 |
|
|
|
IsACG 是一个专注于判断图像是否为 ACG(**Anime、Comic、Game**)风格的轻量化图像分类系列模型。模型基于 **MobileNetV3-Large** 和 **MobileNetV3-Small** 构建,在保证性能的同时注重低资源占用,适用于多种部署环境。 |
|
|
|
--- |
|
|
|
## 模型架构说明 |
|
|
|
- **v1**:`mobilenet_v3_large` |
|
- 参数量约为 5.5M; |
|
- 更高的分类精度,适用于中端服务器或推理精度优先的场景。 |
|
|
|
- **v1s**:`mobilenet_v3_small` |
|
- 参数量约为 2.5M; |
|
- 更轻便、更快的推理速度,适合边缘设备、嵌入式系统和移动端部署。 |
|
|
|
- **v2**:v1s 的改进版本,融合了更广泛的数据训练和数据增强,提升泛化性; |
|
- 参数量相近; |
|
- 在复杂图像(如风格混合、低分辨率)上更具鲁棒性。 |
|
|
|
--- |
|
|
|
## 分类任务 |
|
|
|
- **目标标签**:二分类 |
|
- `"yes"`:图像为动漫、漫画或游戏相关风格; |
|
- `"no"`:图像为现实照片、插画或其他非 ACG 风格。 |
|
|
|
--- |
|
|
|
## 快速使用 |
|
|
|
|
|
|
|
--- |
|
|
|
## 模型配置 |
|
|
|
默认标签配置: |
|
```json |
|
{ |
|
"0": "no", |
|
"1": "yes" |
|
} |
|
``` |
|
|
|
--- |
|
|
|
## 模型性能对比(示例) |
|
|
|
| 模型版本 | 架构 | Accuracy | 推理速度 (FPS) | 参数量 | 主要特点 | |
|
|----------|------------------|----------|----------------|--------|----------------------------| |
|
| v1 | MobileNetV3-Large | 99.1% | 35 | 5.5M | 精度高,适用于服务器环境 | |
|
| v1s | MobileNetV3-Small | 98.9% | 65 | 2.5M | 轻量、快,在移动设备上表现好 | |
|
| v2 | MobileNetV3-Small | 97.5% | 58 | 2.5M | 增强泛化,适用更多风格 | |
|
|
|
--- |
|
|
|
## 数据来源与训练 |
|
|
|
- **数据集结构**: |
|
- 正样本:ACG 图像(动漫截图、漫画分镜、游戏画面); |
|
- 负样本:非 ACG 图像(照片、现代 UI、3D 渲染、自然风景等); |
|
- **优化器**:AdamW |
|
- **学习率调度**:ReduceLROnPlateau |
|
- **训练框架**:PyTorch + TorchVision 库; |
|
- **支持图像尺寸**:512x512 或上下文自适应填充。 |
|
|
|
--- |
|
|
|
## 示例输出 |
|
|
|
| 输入图像 | 输出类别 | |
|
|----------------------|--------------| |
|
| 动漫插画截图 | `"yes"` | |
|
| 漫画分镜 | `"yes"` | |
|
| Steam 商店游戏页面截图 | `"yes"` | |
|
| 真实风景照 | `"no"` | |
|
| 人物写实照片 | `"no"` | |
|
| 篮球明星图像 | `"no"` | |
|
|
|
--- |
|
|
|
## 模型适用场景 |
|
|
|
✅ ACG 图像内容识别与过滤 |
|
✅ 自动打标与数据筛选系统 |
|
✅ 风格分类器嵌入到多模态 AI 系统中 |
|
✅ 低资源设备(v1s/v2)快速判断 |
|
|
|
--- |
|
|
|
## 贡献与扩展 |
|
|
|
该项目遵循 MIT 协议开源,欢迎贡献和改进: |
|
|
|
- 为您提供新类型的 ACG 风格标注; |
|
- 提出改进模型泛化性的训练技巧; |
|
- 添加更多语言的模型描述和推理 API 示例; |
|
|
|
--- |
|
|
|
## 许可协议 |
|
|
|
MIT License,你可以自由用于研究和商业用途。详情请见 [LICENSE](LICENSE)。 |
|
|
|
|