V

Vit Base Patch16 224 Cifar10

karthiksvによって開発
Vision Transformerアーキテクチャに基づく画像分類モデル、CIFAR10データセットでファインチューニング済み
ダウンロード数 31
リリース時間 : 5/13/2022

モデル概要

このモデルはgoogle/vit-base-patch16-224-in21kをcifar10データセットでファインチューニングしたバージョンで、画像分類タスクに使用されます。

モデル特徴

Vision Transformerアーキテクチャ採用
先進的なTransformerアーキテクチャを使用して画像データを処理
CIFAR10ファインチューニング
標準CIFAR10データセットでファインチューニング済み
小サイズ画像処理
224x224ピクセルサイズの画像分類に適応

モデル能力

画像分類
多クラス認識

使用事例

コンピュータビジョン
物体認識
CIFAR10データセット中の10種類の一般的な物体を識別
精度10.04%
画像分類システム
ViTベースの画像分類システムを構築
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase