my_food_modelオープンソース食品画像分類モデル - ViTアーキテクチャに基づき、精度は90％を超えます！

ホーム

My Food Model

iammartian0によって開発

Google Vision Transformer (ViT)アーキテクチャに基づく食品画像分類モデルで、Food101データセットでファインチューニングされ、精度は90.9%を達成

画像分類

Transformers

オープンソースライセンス:Apache-2.0 #食品画像分類 #高精度認識 #ViTファインチューニング

ダウンロード数 18

リリース時間 : 2/22/2023

モデル概要

このモデルはGoogleのViT-base-patch16-224-in21k事前学習モデルを基に、Food101データセットでファインチューニングされた食品画像分類モデルです。主に101種類の異なるカテゴリーの食品画像を識別するために使用されます。

モデル特徴

高精度

Food101データセットで90.9%の分類精度を達成

ViTアーキテクチャベース

Vision Transformerアーキテクチャを使用し、強力な画像特徴抽出能力を有する

少数サンプルでのファインチューニング

わずか5000のトレーニングサンプルでファインチューニングを行い良好な効果を得た

モデル能力

食品画像分類

101種類の食品認識

使用事例

食品認識

レストラン料理認識

レストランで顧客が撮影した料理写真を自動認識するために使用

101種類の一般的な食品を正確に認識

栄養分析アプリケーション

健康アプリでユーザーが撮影した食品写真を自動認識

学習損失	エポック	ステップ	検証損失	正解率
1.6816	0.99	62	1.6141	0.893
1.2596	1.99	124	1.2562	0.913
1.0806	2.99	186	1.1611	0.909

プロパティ	詳細
モデル名	my_food_model
タスク	画像分類 (image-classification)
データセット	food101
評価指標	正解率 (accuracy)
正解率	0.909

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

My Food Model

モデル概要

モデル特徴

モデル能力

使用事例

🚀 マイフードモデル

📚 ドキュメント

モデルの説明

想定される用途と制限

学習と評価データ

学習手順

学習ハイパーパラメータ

学習結果

フレームワークのバージョン

📄 ライセンス

📊 モデル情報