V

Vit Base Nsfw Detector

AdamCoddによって開発
Vision Transformer (ViT)アーキテクチャに基づく画像分類モデルで、画像がNSFW(不適切)コンテンツを含むかどうかを検出するために特別に設計されています。
ダウンロード数 1.2M
リリース時間 : 1/3/2024

モデル概要

このモデルはgoogle/vit-base-patch16-384を微調整したバージョンで、画像をSFW(適切)またはNSFW(不適切)に分類するために使用されます。学習データには約25,000枚の画像(絵画、写真など)が含まれています。

モデル特徴

高い正解率
評価セットで正解率が96.54%、AUCが0.9948に達します。
保守的な分類戦略
モデルの学習時には保守的なアプローチが取られ、「セクシー」な画像をNSFWとして分類し、適切なコンテンツが誤って判断されないようにします。
多様な画像タイプのサポート
様々な画像タイプ(リアルな画像、3D画像、絵画)で学習されており、良好な汎化能力を持っています。

モデル能力

画像分類
NSFWコンテンツ検出
SFWコンテンツ検出

使用事例

コンテンツ審査
ソーシャルメディアのコンテンツフィルタリング
ユーザーがアップロードした画像がNSFWコンテンツを含むかどうかを自動的に検出し、プラットフォームのコンテンツ審査を支援します。
正解率96.54%で、人手による審査の負担を効果的に軽減できます。
安全な検索フィルタリング
検索エンジンや画像ライブラリで不適切な画像コンテンツをフィルタリングします。
高い正解率とAUC値により、フィルタリングの効果が保証されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase