V

Vit Base Patch16 224 In21k Finetuned Cifar10 Album Vitvmmrdb Make Model Album Pred

Developed by venetis
ViTアーキテクチャに基づくVision Transformerモデルで、CIFAR-10データセットでファインチューニングされ、画像分類タスクに使用されます
Downloads 30
Release Time : 11/27/2022

Model Overview

このモデルはGoogle Vision Transformer(ViT)アーキテクチャに基づく画像分類モデルで、CIFAR-10データセットでファインチューニングされており、10種類の一般的な物体を正確に分類できます。

Model Features

高精度
CIFAR-10テストセットで85.72%の精度を達成
Transformerアーキテクチャベース
Vision Transformer(ViT)アーキテクチャを採用し、自己注意メカニズムを使用して画像を処理
小サイズ画像処理
224x224ピクセルサイズの画像に最適化

Model Capabilities

画像分類
物体認識
視覚的特徴抽出

Use Cases

コンピュータビジョン
CIFAR-10画像分類
CIFAR-10データセットの10種類の物体を分類
精度85.72%
一般的な物体認識
飛行機、車、鳥などの一般的な物体を認識
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase