V

Vit Base Patch16 224 Finetuned

clpによって開発
Google Vision Transformer (ViT)モデルを基に微調整した画像分類モデルで、カスタム画像データセットでトレーニング済み
ダウンロード数 30
リリース時間 : 11/28/2022

モデル概要

このモデルは画像フォルダデータセットでgoogle/vit-base-patch16-224を微調整したバージョンで、主に画像分類タスクに使用されます

モデル特徴

ViTアーキテクチャベース
Vision Transformerアーキテクチャを使用し、画像分類タスクに適しています
微調整モデル
特定の画像データセットで微調整されており、特定の分類ニーズに対応
中規模モデル
ViT-baseモデルを基にしており、性能と計算リソースのバランスが取れています

モデル能力

画像分類
視覚的特徴抽出

使用事例

画像認識
汎用画像分類
入力画像を分類識別
評価セットで33.33%の精度を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase