V

Vit Base Cifar10

simlaharmaによって開発
ViTアーキテクチャに基づきCIFAR-10データセットでファインチューニングされた画像分類モデル
ダウンロード数 39
リリース時間 : 1/4/2023

モデル概要

このモデルはgoogle/vit-base-patch16-224-in21k事前学習モデルを基に、CIFAR-10データセットでファインチューニングされたVision Transformerモデルで、主に画像分類タスクに使用されます。

モデル特徴

Transformerベースの視覚モデル
Vision Transformerアーキテクチャを採用し、自然言語処理のTransformerをコンピュータビジョンタスクに成功裏に適用
CIFAR-10ファインチューニング
標準画像分類データセットCIFAR-10でファインチューニングされ、10クラス物体認識タスクに適応

モデル能力

画像分類
物体認識

使用事例

コンピュータビジョン
基本画像分類
入力画像を10クラス物体分類
CIFAR-10テストセットでの精度は10.6%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase