V

Vit Base Patch16 224 In21k Wr

Imeneによって開発
このモデルはgoogle/vit-base-patch16-224-in21kを未知のデータセットでファインチューニングしたVision Transformerモデルで、主に画像分類タスクに使用されます。
ダウンロード数 21
リリース時間 : 9/7/2022

モデル概要

これはVision Transformerアーキテクチャに基づく画像分類モデルで、未知のデータセットでファインチューニングされており、一般的な画像認識タスクに適しています。

モデル特徴

事前学習モデルに基づくファインチューニング
google/vit-base-patch16-224-in21k事前学習モデルを基にファインチューニングされており、強力な画像特徴抽出能力を継承しています
混合精度トレーニング
mixed_float16精度を使用してトレーニングを行い、トレーニング速度とモデル精度を両立させています
オプティマイザ設定
AdamWeightDecayオプティマイザとPolynomialDecay学習率スケジューリングを採用し、トレーニングプロセスの安定化に役立っています

モデル能力

画像分類
特徴抽出

使用事例

コンピュータビジョン
一般的な画像分類
一般的な物体やシーンを分類・識別するために使用可能
検証精度57.7%、トップ3精度80.35%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase