# 金融文書処理

Typhoon Ocr 7b
タイ・英語バイリンガルの現実世界文書解析のために特別に設計された視覚言語モデル、Qwen2.5-VL-Instructionフレームワークベース
画像生成テキスト Transformers 複数言語対応
T
scb10x
126
9
Qwen Vl 2.5 3B Finetuned Cheque
ビジュアル言語モデルで、小切手画像から構造化された金融情報を抽出し、小切手番号、受取人、金額、発行日などの重要な情報を含むJSON形式の出力を生成することに特化しています。
画像生成テキスト Transformers 英語
Q
AJNG
170
1
Qwen2 VL 2B OCR
Apache-2.0
Qwen2-VL-2B-OCRはunsloth/Qwen2-VL-2B-Instructを微調整したOCRモデルで、文書、表、給与明細画像から完全なテキストを抽出することに特化しています。
画像生成テキスト Transformers 英語
Q
JackChew
842
4
Sk Invoice Receipts
Apache-2.0
Donutアーキテクチャをファインチューニングした実験用モデルで、請求書や領収書の画像をXMLまたはJSONデータ構造に変換するために特別に設計されており、従来のOCRエンジンを必要としません。
画像生成テキスト Transformers
S
selvakumarcts
201
39
Invoice And Receipts Donut V1
Apache-2.0
Donutアーキテクチャに基づく大規模言語モデルで、請求書や領収書の画像を構造化データに変換するために設計
画像生成テキスト Transformers
I
mychen76
2,945
54
Tatr Tab Struct V2
PubTables1MとFinTabNetデータセットで訓練されたDETRアーキテクチャモデルで、表構造認識タスク専用
文字認識 Transformers
T
deepdoctection
99
2
Donut Base Payslips
MIT
Donutアーキテクチャに基づく文書理解モデルで、給与明細画像処理に特化してファインチューニング
文字認識 Transformers
D
Assadullah
20
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase