vit-base-patch32-224-in21k-finetuned-eurosatオープンソースモデル

ホーム

Vit Base Patch32 224 In21k Finetuned Eurosat

sshreshthaによって開発

Google Vision Transformer (ViT)アーキテクチャに基づく画像分類モデルで、food101データセットでファインチューニングされ、食品画像分類タスクに使用されます

画像分類

Transformers

オープンソースライセンス:Apache-2.0 #食品画像分類 #高精度ViT #転移学習ファインチューニング

ダウンロード数 30

リリース時間 : 11/24/2022

モデル概要

このモデルはVision Transformerアーキテクチャの事前学習モデルで、food101食品分類データセットでファインチューニングされており、101種類の異なるカテゴリの食品画像を分類識別できます

モデル特徴

Vision Transformerアーキテクチャに基づく

先進的なTransformerアーキテクチャを使用して視覚タスクを処理し、強力な特徴抽出能力を持っています

食品画像分類

101クラスの食品画像に特化して最適化された分類モデル

高精度

food101テストセットで73.21%の分類精度を達成

モデル能力

食品画像分類

視覚的特徴抽出

多クラス画像認識

使用事例

食品識別

飲食業の料理識別

レストランで料理画像を自動識別し、スマートメニュー管理を実現

101種類の一般的な食品カテゴリを正確に識別可能

健康的な食事アプリ

モバイルアプリに統合してユーザーが食物を識別し食事を記録するのを支援

学習損失	エポック	ステップ	検証損失	正解率
2.6483	1.0	532	2.5574	0.6605
1.8885	2.0	1064	1.8063	0.7182
1.6371	3.0	1596	1.6175	0.7321

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Vit Base Patch32 224 In21k Finetuned Eurosat

モデル概要

モデル特徴

モデル能力

使用事例

🚀 vit-base-patch32-224-in21k-finetuned-eurosat

📚 ドキュメント

モデルの概要

想定される用途と制限事項

学習と評価データ

🔧 技術詳細

学習手順

学習ハイパーパラメータ

学習結果

フレームワークのバージョン

📄 ライセンス