V

Vit Finetuned Food101

ashaduzzamanによって開発
これはFood-101データセットでファインチューニングされたVision Transformerモデルで、食品画像分類タスクに使用されます。
ダウンロード数 162
リリース時間 : 8/28/2024

モデル概要

このモデルはGoogleのViTアーキテクチャに基づいており、101種類の食品カテゴリに特化して最適化されており、食事追跡やレストランメニュー分析などのシーンに適しています。

モデル特徴

高精度食品分類
Food-101テストセットで89.6%の精度を達成し、101種類の異なる食品カテゴリを正確に識別できます。
ViTアーキテクチャベース
Vision Transformerアーキテクチャを採用し、自己注意機構を利用して画像のグローバルな特徴を捉えます。
転移学習最適化
事前学習済みViTモデルを基にファインチューニングを行い、大規模画像データから学習した特徴を効果的に活用します。

モデル能力

食品画像分類
多カテゴリ識別
食事分析

使用事例

食事健康
自動食事記録
ユーザーが写真を撮ることで食事内容を自動記録するのを支援
101種類の一般的な食品を正確に識別
飲食業界
メニュー分析
レストランメニュー内の食品分類を自動分析
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase