🚀 siglip2-x256-explicit-content
siglip2-x256-explicit-content 是一个基于视觉语言编码器的模型,它在 siglip2-base-patch16-256 的基础上进行微调,用于 多类别图像分类。该模型基于 SiglipForImageClassification 架构构建,经过训练能够识别和分类图像中的内容类型,尤其适用于 色情、暗示性或安全媒体的过滤。
🚀 快速开始
安装依赖
pip install -q transformers torch pillow gradio
推理代码
import gradio as gr
from transformers import AutoImageProcessor, SiglipForImageClassification
from PIL import Image
import torch
model_name = "prithivMLmods/siglip2-x256-explicit-content"
model = SiglipForImageClassification.from_pretrained(model_name)
processor = AutoImageProcessor.from_pretrained(model_name)
id2label = {
"0": "Anime Picture",
"1": "Hentai",
"2": "Normal",
"3": "Pornography",
"4": "Enticing or Sensual"
}
def classify_explicit_content(image):
image = Image.fromarray(image).convert("RGB")
inputs = processor(images=image, return_tensors="pt")
with torch.no_grad():
outputs = model(**inputs)
logits = outputs.logits
probs = torch.nn.functional.softmax(logits, dim=1).squeeze().tolist()
prediction = {
id2label[str(i)]: round(probs[i], 3) for i in range(len(probs))
}
return prediction
iface = gr.Interface(
fn=classify_explicit_content,
inputs=gr.Image(type="numpy"),
outputs=gr.Label(num_top_classes=5, label="Predicted Content Type"),
title="siglip2-x256-explicit-content",
description="Classifies images into explicit, suggestive, or safe categories (e.g., Hentai, Pornography, Normal)."
)
if __name__ == "__main__":
iface.launch()
✨ 主要特性
- 多类别图像分类:能够将图像分为多个类别,包括动漫图片、色情内容、正常内容等。
- 内容过滤:可用于检测和过滤色情、暗示性或安全媒体内容。
📚 详细文档
标签空间:5 个类别
该模型将每张图像分类到以下内容类别之一:
Class 0: "Anime Picture"
Class 1: "Hentai"
Class 2: "Normal"
Class 3: "Pornography"
Class 4: "Enticing or Sensual"
分类报告
Classification Report:
precision recall f1-score support
Anime Picture 0.8940 0.8718 0.8827 5600
Hentai 0.8961 0.8935 0.8948 4180
Normal 0.9100 0.8895 0.8997 5503
Pornography 0.9496 0.9654 0.9574 5600
Enticing or Sensual 0.9132 0.9429 0.9278 5600
accuracy 0.9137 26483
macro avg 0.9126 0.9126 0.9125 26483
weighted avg 0.9135 0.9137 0.9135 26483
预期用途
此模型适用于以下应用场景:
- 内容审核:自动检测不适合工作场所(NSFW)或具有暗示性的内容。
- 家长控制:实现基于人工智能的过滤,确保安全的媒体浏览。
- 数据集预处理:清理和分类图像数据集,用于研究或部署。
- 在线平台:帮助执行上传内容和用户生成媒体的内容准则。
📄 许可证
本项目采用 Apache-2.0 许可证。
引用
SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features https://arxiv.org/pdf/2502.14786
模型相关信息
属性 |
详情 |
基础模型 |
google/siglip2-base-patch16-256 |
任务类型 |
图像分类 |
库名称 |
transformers |
标签 |
siglip2、256、patch16、成人内容检测、明确内容检测 |
模型图片
