G

Google Vit Base Patch16 224 Cartoon Face Recognition

jayantaによって開発
Google Vision Transformer (ViT)アーキテクチャを基にファインチューニングしたアニメ顔認識モデルで、画像分類タスクで優れた性能を発揮します
ダウンロード数 62
リリース時間 : 1/18/2023

モデル概要

このモデルはgoogle/vit-base-patch16-224を画像フォルダデータセットでファインチューニングしたバージョンで、アニメ顔認識タスク専用です。評価データセットで90%以上の精度を達成しました。

モデル特徴

高精度認識
アニメ顔認識タスクで90.05%の精度と90.66%の適合率を達成
ViTアーキテクチャ採用
Vision Transformerアーキテクチャを採用し、強力な画像特徴抽出能力を有する
効率的なファインチューニング
ベースモデル上でファインチューニングを行い、トレーニング効率が高く、リソース消費が比較的少ない

モデル能力

アニメ顔認識
画像分類
特徴抽出

使用事例

エンターテインメントアプリケーション
アニメキャラクター認識
アニメや漫画のキャラクターを識別
精度90.05%
表情分類
アニメキャラクターの表情を分類・識別
セキュリティ検証
アニメアバター検証
ユーザーがアップロードしたアニメアバターが要件を満たしているか検証
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase