moyanjdc
/

IsACG

Image Classification

binary-classification

computer-vision

Model card Files Files and versions

IsACG / README.md

moyanjdc's picture

Update README.md

12e43f2 verified 3 months ago

|

history blame contribute delete

3.34 kB

	---
	license: mit
	language:
	- zh
	- en
	pipeline_tag: image-classification
	tags:
	- image-classification
	- binary-classification
	- mobilenetv3
	- pytorch
	- acg
	- anime
	- comic
	- game
	- computer-vision

	---

	# IsACG – “是否是 ACG 图像”的二分类模型系列

	IsACG 是一个专注于判断图像是否为 ACG（Anime、Comic、Game）风格的轻量化图像分类系列模型。模型基于 MobileNetV3-Large 和 MobileNetV3-Small 构建，在保证性能的同时注重低资源占用，适用于多种部署环境。

	---

	## 模型架构说明

	- v1：`mobilenet_v3_large`
	- 参数量约为 5.5M；
	- 更高的分类精度，适用于中端服务器或推理精度优先的场景。

	- v1s：`mobilenet_v3_small`
	- 参数量约为 2.5M；
	- 更轻便、更快的推理速度，适合边缘设备、嵌入式系统和移动端部署。

	- v2：v1s 的改进版本，融合了更广泛的数据训练和数据增强，提升泛化性；
	- 参数量相近；
	- 在复杂图像（如风格混合、低分辨率）上更具鲁棒性。

	---

	## 分类任务

	- 目标标签：二分类
	- `"yes"`：图像为动漫、漫画或游戏相关风格；
	- `"no"`：图像为现实照片、插画或其他非 ACG 风格。

	---

	## 快速使用



	---

	## 模型配置

	默认标签配置：
	```json
	{
	"0": "no",
	"1": "yes"
	}
	```

	---

	## 模型性能对比（示例）

	\| 模型版本 \| 架构 \| Accuracy \| 推理速度 (FPS) \| 参数量 \| 主要特点 \|
	\|----------\|------------------\|----------\|----------------\|--------\|----------------------------\|
	\| v1 \| MobileNetV3-Large \| 99.1% \| 35 \| 5.5M \| 精度高，适用于服务器环境 \|
	\| v1s \| MobileNetV3-Small \| 98.9% \| 65 \| 2.5M \| 轻量、快，在移动设备上表现好 \|
	\| v2 \| MobileNetV3-Small \| 97.5% \| 58 \| 2.5M \| 增强泛化，适用更多风格 \|

	---

	## 数据来源与训练

	- 数据集结构：
	- 正样本：ACG 图像（动漫截图、漫画分镜、游戏画面）；
	- 负样本：非 ACG 图像（照片、现代 UI、3D 渲染、自然风景等）；
	- 优化器：AdamW
	- 学习率调度：ReduceLROnPlateau
	- 训练框架：PyTorch + TorchVision 库；
	- 支持图像尺寸：512x512 或上下文自适应填充。

	---

	## 示例输出

	\| 输入图像 \| 输出类别 \|
	\|----------------------\|--------------\|
	\| 动漫插画截图 \| `"yes"` \|
	\| 漫画分镜 \| `"yes"` \|
	\| Steam 商店游戏页面截图 \| `"yes"` \|
	\| 真实风景照 \| `"no"` \|
	\| 人物写实照片 \| `"no"` \|
	\| 篮球明星图像 \| `"no"` \|

	---

	## 模型适用场景

	✅ ACG 图像内容识别与过滤
	✅ 自动打标与数据筛选系统
	✅ 风格分类器嵌入到多模态 AI 系统中
	✅ 低资源设备（v1s/v2）快速判断

	---

	## 贡献与扩展

	该项目遵循 MIT 协议开源，欢迎贡献和改进：

	- 为您提供新类型的 ACG 风格标注；
	- 提出改进模型泛化性的训练技巧；
	- 添加更多语言的模型描述和推理 API 示例；

	---

	## 许可协议

	MIT License，你可以自由用于研究和商业用途。详情请见 [LICENSE](LICENSE)。