V

Vit Base Patch16 224 In21k Finetuned Cifar10 Album Vitvmmrdb Make Model Album Pred

venetisによって開発
ViTアーキテクチャに基づくVision Transformerモデルで、CIFAR-10データセットでファインチューニングされ、画像分類タスクに使用されます
ダウンロード数 30
リリース時間 : 11/27/2022

モデル概要

このモデルはGoogle Vision Transformer(ViT)アーキテクチャに基づく画像分類モデルで、CIFAR-10データセットでファインチューニングされており、10種類の一般的な物体を正確に分類できます。

モデル特徴

高精度
CIFAR-10テストセットで85.72%の精度を達成
Transformerアーキテクチャベース
Vision Transformer(ViT)アーキテクチャを採用し、自己注意メカニズムを使用して画像を処理
小サイズ画像処理
224x224ピクセルサイズの画像に最適化

モデル能力

画像分類
物体認識
視覚的特徴抽出

使用事例

コンピュータビジョン
CIFAR-10画像分類
CIFAR-10データセットの10種類の物体を分類
精度85.72%
一般的な物体認識
飛行機、車、鳥などの一般的な物体を認識
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase