vit-base-patch16-224-cifar10オープンソース画像分類モデル

Vit Base Patch16 224 Cifar10

karthiksvによって開発

Vision Transformerアーキテクチャに基づく画像分類モデル、CIFAR10データセットでファインチューニング済み

ダウンロード数 31

リリース時間 : 5/13/2022

モデル概要

このモデルはgoogle/vit-base-patch16-224-in21kをcifar10データセットでファインチューニングしたバージョンで、画像分類タスクに使用されます。

Vision Transformerアーキテクチャ採用

先進的なTransformerアーキテクチャを使用して画像データを処理

CIFAR10ファインチューニング

標準CIFAR10データセットでファインチューニング済み

小サイズ画像処理

224x224ピクセルサイズの画像分類に適応

画像分類

多クラス認識

コンピュータビジョン

物体認識

CIFAR10データセット中の10種類の一般的な物体を識別

精度10.04%

画像分類システム

ViTベースの画像分類システムを構築

Property	Details
Model Type	image-classification
Training Data	cifar10