🚀 ViT Fine-tuned on Food-101
このモデルは、画像分類タスクに特化したモデルで、Food-101データセットを用いて微調整されています。Vision Transformer (ViT) アーキテクチャを利用し、食品の画像を認識・分類することができます。
🚀 クイックスタート
このモデルは、google/vit-base-patch16-224-in21k をFood-101データセットで微調整したものです。Vision Transformer (ViT) アーキテクチャを用いて画像分類タスクを行い、特に食品の画像を認識・分類するために設計されています。
✨ 主な機能
モデル詳細
性能
このモデルは、評価セットで以下の結果を達成しています。
想定使用目的と制限
想定使用ケース
- 画像分類: このモデルは、101種類の食品カテゴリに画像を分類するために設計されており、食事記録アプリの食品認識、レストランメニュー分析、食品関連の検索エンジンなどのアプリケーションに適しています。
制限
- データセットバイアス: このモデルは、Food-101データセットと大きく異なる食品画像、例えば非西洋料理や非標準条件で撮影された画像に対しては性能が低下する可能性があります。
- 汎化能力: このモデルはFood-101データセットで良好な性能を示しますが、他の食品関連のタスクやデータセットに対する汎化能力は保証されていません。
- 入力サイズ: このモデルは224x224ピクセルの入力画像を期待しています。異なるサイズの画像は適切にリサイズする必要があります。
学習と評価データ
このモデルは、101種類の食品カテゴリにまたがる101,000枚の画像から構成されるFood-101データセットで微調整されました。各カテゴリには1,000枚の画像が含まれており、そのうち750枚が学習用、250枚がテスト用に使用されています。このデータセットには多様な食品が含まれていますが、特定の料理や食品タイプに偏っている可能性があります。
学習手順
学習ハイパーパラメータ
このモデルは、以下のハイパーパラメータを使用して微調整されました。
- 学習率: 5e-05
- 学習バッチサイズ: 16
- 評価バッチサイズ: 16
- シード: 42
- 勾配累積ステップ: 4
- 総学習バッチサイズ: 64
- オプティマイザ: Adam (betas=(0.9, 0.999), epsilon=1e-08)
- 学習率スケジューラ: ウォームアップ率0.1の線形スケジューラ
- エポック数: 3
学習結果
学習損失 |
エポック |
ステップ |
検証損失 |
正確率 |
2.7649 |
0.992 |
62 |
2.5733 |
0.831 |
1.888 |
2.0 |
125 |
1.7770 |
0.883 |
1.6461 |
2.976 |
186 |
1.6262 |
0.896 |
フレームワークバージョン
- Transformers: 4.42.4
- PyTorch: 2.4.0+cu121
- Datasets: 2.21.0
- Tokenizers: 0.19.1
💻 使用例
基本的な使用法
このモデルを使用して推論を実行するには、Food-101データセットから画像をロードし、以下のように分類することができます。
from datasets import load_dataset
from transformers import pipeline
from PIL import Image
import requests
from io import BytesIO
image_url = "https://example.com/path-to-your-image.jpg"
response = requests.get(image_url)
image = Image.open(BytesIO(response.content))
classifier = pipeline(
"image-classification",
model="ashaduzzaman/vit-finetuned-food101"
)
result = classifier(image)
print(result)
📚 ドキュメント
倫理的な考慮事項
- バイアス: Food-101データセットは主に人気の西洋料理で構成されているため、非西洋料理の食品に対するモデルの予測にバイアスが生じる可能性があります。
- プライバシー: このモデルをアプリケーションで使用する場合は、画像が倫理的に取得されており、プライバシーに関する考慮事項が尊重されていることを確認してください。
引用
このモデルをあなたの研究で使用する場合は、次のように引用してください。
@misc{vit_finetuned_food101,
author = {Ashaduzzaman},
title = {ViT Fine-tuned on Food-101},
year = {2024},
url = {https://huggingface.co/ashaduzzaman/vit-finetuned-food101},
}
📄 ライセンス
このモデルは、Apache-2.0ライセンスの下で提供されています。