vit-base-patch16-224-finetuned-og-dataset-10eオープンソースビジュアルモデル

ホーム

Vit Base Patch16 224 Finetuned Og Dataset 10e

Gokulapriyanによって開発

GoogleのViTモデルをカスタム画像データセットでファインチューニングしたVision Transformerモデル、評価精度97.7%

画像分類

Transformers

オープンソースライセンス:Apache-2.0 #高精度画像分類 #ViTファインチューニングモデル #少数サンプル学習

ダウンロード数 17

リリース時間 : 2/18/2023

モデル概要

このモデルはGoogleのViT-base-patch16-224アーキテクチャを画像分類タスクでファインチューニングしたバージョンで、汎用画像認識タスクに適しています

モデル特徴

高精度

評価データセットで97.7%の分類精度を達成

効率的な推論

1秒あたり46.82サンプルを処理可能、リアルタイムアプリケーションに適している

Transformerアーキテクチャベース

先進的なVision Transformerアーキテクチャを採用し、強力な特徴抽出能力を有する

モデル能力

画像分類

特徴抽出

転移学習

使用事例

コンピュータビジョン

汎用画像分類

様々な画像を分類・識別

評価精度97.7%

転移学習ベースモデル

他の視覚タスクの事前学習モデルとして利用可能

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Vit Base Patch16 224 Finetuned Og Dataset 10e

モデル概要

モデル特徴

モデル能力

使用事例

🚀 vit-base-patch16-224-finetuned-og-dataset-10e

🚀 クイックスタート

🔧 技術詳細

トレーニングハイパーパラメータ

フレームワークバージョン

📄 ライセンス