V

Vit Base Oxford Iiit Pets

ISxOdinによって開発
Google Vision Transformer (ViT)をファインチューニングしたペット品種分類モデルで、Oxford-IIITペットデータセットで94.45%の精度を達成
ダウンロード数 78
リリース時間 : 4/1/2025

モデル概要

このモデルはgoogle/vit-base-patch16-224をpcuenq/oxford-petsデータセットでファインチューニングしたバージョンで、37種類の異なる猫と犬の品種を識別する画像分類タスク専用です。

モデル特徴

高精度
Oxford-IIITペットデータセットで94.45%の分類精度を達成
転移学習
事前学習済みVision Transformerモデルを基にファインチューニングし、事前学習知識を効果的に活用
教育向け
転移学習と視覚モデルのファインチューニングの教育デモケースとして適しています

モデル能力

画像分類
ペット品種識別
転移学習ファインチューニング

使用事例

教育
転移学習教育
コンピュータビジョンコースにおける転移学習の教育ケースとして
ペット識別
ペット品種分類
37種類の異なる猫と犬の品種を識別
94.45%精度
モデル比較
ゼロショットモデルとの比較
CLIPなどのゼロショットモデルとの性能比較分析
CLIP精度88.00%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase