vit - base - patch16 - 224 - in21k - finetuned - cifar10オープンソース画像分類モデル

ホーム

Vit Base Patch16 224 In21k Finetuned Cifar10

karthiksvによって開発

このモデルはGoogleのViT-baseモデルをCIFAR-10データセットでファインチューニングしたバージョンで、画像分類タスクに適しています。

画像分類

Transformers

オープンソースライセンス:Apache-2.0 #ViTファインチューニングモデル #小規模画像分類 #転移学習

ダウンロード数 14

リリース時間 : 5/13/2022

モデル概要

これはVision Transformer (ViT)アーキテクチャに基づく画像分類モデルで、特にCIFAR-10データセット向けにファインチューニングされています。

モデル特徴

ViTアーキテクチャベース

Vision Transformerアーキテクチャを採用し、自己注意機構を用いて画像データを処理します。

CIFAR-10ファインチューニング

CIFAR-10データセット向けに最適化されており、10クラスの画像分類タスクに適しています。

事前学習モデルのファインチューニング

ImageNet-21kで事前学習されたViTモデルを基にファインチューニングされており、優れた特徴抽出能力を持っています。

モデル能力

画像分類

特徴抽出

使用事例

コンピュータビジョン

CIFAR-10画像分類

CIFAR-10データセットの10クラス画像を分類します

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Vit Base Patch16 224 In21k Finetuned Cifar10

モデル概要

モデル特徴

モデル能力

使用事例

🚀 vit-base-patch16-224-in21k-finetuned-cifar10

🚀 クイックスタート

🔧 技術詳細

学習ハイパーパラメータ

フレームワークバージョン

📄 ライセンス