V

Vit Base Patch16 224 In21k Finetuned Cifar10

nielsrによって開発
これはGoogleのViT基礎モデルに基づき、CIFAR10データセットで微調整されたビジュアルTransformerモデルで、画像分類タスクに使用されます。
ダウンロード数 31
リリース時間 : 3/2/2022

モデル概要

このモデルはVision Transformer (ViT)アーキテクチャに基づく画像分類モデルで、CIFAR10データセットで微調整後、98.81%の正解率を達成しました。

モデル特徴

高い正解率
CIFAR10テストセットで98.81%の分類正解率を達成しました。
Transformerアーキテクチャに基づく
Vision Transformer (ViT)アーキテクチャを使用しており、画像データの処理に適しています。
事前学習モデルの微調整
google/vit-base-patch16-224-in21k事前学習モデルに基づいて微調整されました。

モデル能力

画像分類
ビジュアル特徴抽出

使用事例

コンピュータビジョン
CIFAR10画像分類
CIFAR10データセットの画像を分類します。
正解率は98.81%に達します。
汎用画像分類
他の同様の規模の画像分類タスクに使用できます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase