V

Vit Receipts Classifier

jjmcarrascosaによって開発
ViTアーキテクチャに基づくバイナリ分類モデルで、画像が領収書/レシートかどうかを識別
ダウンロード数 75
リリース時間 : 8/26/2022

モデル概要

このモデルはViTアーキテクチャのファインチューニング版で、領収書と非領収書画像のバイナリ分類タスク専用。評価セットで優れた性能を発揮し、F1スコアは0.9991を達成。

モデル特徴

高精度分類
評価セットでF1スコア0.9991を達成し、領収書と非領収書画像を正確に区別可能
多様なデータソースでの学習
CORD、RVL-CDIP、Visual-Genomeなど複数のデータセットを使用してトレーニングし、モデルの汎化能力を強化
多様な画像形式に対応
スキャン画像、写真撮影、携帯電話撮影のカラー/グレースケール画像を処理可能

モデル能力

画像分類
領収書認識
レシート検出

使用事例

文書処理
自動領収書分類
企業財務システムでアップロードされた領収書画像を自動識別・分類
精度99.9%を達成
レシート管理システム
OCR技術と組み合わせ、エンドツーエンドのレシート情報抽出システムを構築
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase