V

Vit Base 224 In21k Ft Cifar100

edumunozsalaによって開発
Vision Transformerアーキテクチャに基づく画像分類モデルで、CIFAR-100データセットでファインチューニングされ、精度は91.48%
ダウンロード数 357
リリース時間 : 6/11/2022

モデル概要

このモデルはVision Transformerアーキテクチャを使用し、ImageNet-21kで事前学習後、CIFAR-100データセットでファインチューニングされ、画像分類タスク専用です。

モデル特徴

高精度
CIFAR-100テストセットで91.48%の精度を達成
Transformerアーキテクチャベース
Vision Transformerアーキテクチャを採用し、画像処理タスクに適しています
事前学習+ファインチューニング
最初にImageNet-21kで事前学習し、その後CIFAR-100でファインチューニング

モデル能力

画像分類
特徴抽出

使用事例

コンピュータビジョン
物体認識
画像内の物体カテゴリを識別
CIFAR-100の100カテゴリで良好な性能
画像分類システム
自動画像分類システムを構築
製品分類、コンテンツ審査などのシナリオに使用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase