Q

Qwen2 VL 2B OCR

JackChewによって開発
Qwen2-VL-2B-OCRはunsloth/Qwen2-VL-2B-Instructを微調整したOCRモデルで、文書、表、給与明細画像から完全なテキストを抽出することに特化しています。
ダウンロード数 842
リリース時間 : 12/28/2024

モデル概要

このモデルは光学文字認識(OCR)タスクに最適化されており、給与明細、請求書、表などの様々な文書から正確にテキストを抽出し、情報の漏れを防ぎます。

モデル特徴

完全テキスト抽出
文書から全てのテキストを抽出することに焦点を当て、重要な情報が漏れないようにします。
効率的な微調整
UnslothフレームワークとHuggingfaceのTRLライブラリを使用して微調整を行い、トレーニング速度を2倍向上させました。
OCR性能の最適化
給与明細、表などの構造化された文書のテキスト抽出に特化して最適化されています。

モデル能力

画像テキスト抽出
構造化文書処理
給与明細データ分析
表データ抽出

使用事例

金融
給与明細処理
給与明細画像から従業員情報、収入、控除項目などの完全なデータを抽出します。
控除部分の抽出が大幅に改善され、情報の完全性が確保されます。
文書管理
請求書処理
請求書画像から仕入先、金額、日付などの重要な情報を抽出します。
構造化データを正確に抽出し、手動入力のエラーを減らします。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase