V

Vit Base Patch16 224 In21k Snacks

matteopilottoによって開発
ImageNet-21kで事前学習されたVision Transformerモデルで、スナック画像分類タスクに特化してファインチューニングされています
ダウンロード数 37
リリース時間 : 5/14/2022

モデル概要

このモデルはImageNet-21kで事前学習されたVision Transformerで、Matthijs/snacksスナックデータセットでファインチューニングされており、スナック画像分類タスクに特化しています。

モデル特徴

高精度分類
スナックテストセットで89.29%の精度を達成
データ拡張
ランダムクロップ、水平反転、シャープネス調整など様々なデータ拡張技術を使用
転移学習
ImageNet-21k大規模事前学習モデルを基にファインチューニング

モデル能力

スナック画像分類
食品認識
視覚的特徴抽出

使用事例

小売・飲食
自動レジシステム
スーパーマーケットで顧客が選んだスナック商品を自動認識
手動バーコードスキャンを代替し、レジ効率を向上
食品在庫管理
棚にあるスナック商品を自動認識
在庫状況のリアルタイム監視を支援
健康・栄養
食事記録アプリ
写真撮影でユーザーが摂取したスナックを自動記録
ユーザーの食習慣追跡を支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase