IsACG / README.md
moyanjdc's picture
Update README.md
12e43f2 verified
---
license: mit
language:
- zh
- en
pipeline_tag: image-classification
tags:
- image-classification
- binary-classification
- mobilenetv3
- pytorch
- acg
- anime
- comic
- game
- computer-vision
---
# IsACG – “是否是 ACG 图像”的二分类模型系列
IsACG 是一个专注于判断图像是否为 ACG(**Anime、Comic、Game**)风格的轻量化图像分类系列模型。模型基于 **MobileNetV3-Large****MobileNetV3-Small** 构建,在保证性能的同时注重低资源占用,适用于多种部署环境。
---
## 模型架构说明
- **v1**`mobilenet_v3_large`
- 参数量约为 5.5M;
- 更高的分类精度,适用于中端服务器或推理精度优先的场景。
- **v1s**`mobilenet_v3_small`
- 参数量约为 2.5M;
- 更轻便、更快的推理速度,适合边缘设备、嵌入式系统和移动端部署。
- **v2**:v1s 的改进版本,融合了更广泛的数据训练和数据增强,提升泛化性;
- 参数量相近;
- 在复杂图像(如风格混合、低分辨率)上更具鲁棒性。
---
## 分类任务
- **目标标签**:二分类
- `"yes"`:图像为动漫、漫画或游戏相关风格;
- `"no"`:图像为现实照片、插画或其他非 ACG 风格。
---
## 快速使用
---
## 模型配置
默认标签配置:
```json
{
"0": "no",
"1": "yes"
}
```
---
## 模型性能对比(示例)
| 模型版本 | 架构 | Accuracy | 推理速度 (FPS) | 参数量 | 主要特点 |
|----------|------------------|----------|----------------|--------|----------------------------|
| v1 | MobileNetV3-Large | 99.1% | 35 | 5.5M | 精度高,适用于服务器环境 |
| v1s | MobileNetV3-Small | 98.9% | 65 | 2.5M | 轻量、快,在移动设备上表现好 |
| v2 | MobileNetV3-Small | 97.5% | 58 | 2.5M | 增强泛化,适用更多风格 |
---
## 数据来源与训练
- **数据集结构**
- 正样本:ACG 图像(动漫截图、漫画分镜、游戏画面);
- 负样本:非 ACG 图像(照片、现代 UI、3D 渲染、自然风景等);
- **优化器**:AdamW
- **学习率调度**:ReduceLROnPlateau
- **训练框架**:PyTorch + TorchVision 库;
- **支持图像尺寸**:512x512 或上下文自适应填充。
---
## 示例输出
| 输入图像 | 输出类别 |
|----------------------|--------------|
| 动漫插画截图 | `"yes"` |
| 漫画分镜 | `"yes"` |
| Steam 商店游戏页面截图 | `"yes"` |
| 真实风景照 | `"no"` |
| 人物写实照片 | `"no"` |
| 篮球明星图像 | `"no"` |
---
## 模型适用场景
✅ ACG 图像内容识别与过滤
✅ 自动打标与数据筛选系统
✅ 风格分类器嵌入到多模态 AI 系统中
✅ 低资源设备(v1s/v2)快速判断
---
## 贡献与扩展
该项目遵循 MIT 协议开源,欢迎贡献和改进:
- 为您提供新类型的 ACG 风格标注;
- 提出改进模型泛化性的训练技巧;
- 添加更多语言的模型描述和推理 API 示例;
---
## 许可协议
MIT License,你可以自由用于研究和商业用途。详情请见 [LICENSE](LICENSE)。