# 金融文檔處理

Typhoon Ocr 7b
專為泰英雙語現實場景文檔解析打造的視覺語言模型,基於Qwen2.5-VL-Instruction框架
圖像生成文本 Transformers 支持多種語言
T
scb10x
126
9
Qwen Vl 2.5 3B Finetuned Cheque
一款視覺語言模型,專門用於從支票圖像中提取結構化的金融信息,生成包含支票號碼、收款人、金額和簽發日期等關鍵信息的JSON格式輸出。
圖像生成文本 Transformers 英語
Q
AJNG
170
1
Qwen2 VL 2B OCR
Apache-2.0
Qwen2-VL-2B-OCR是基於unsloth/Qwen2-VL-2B-Instruct微調的OCR模型,專注於從文檔、表格和工資單圖像中提取完整文本。
圖像生成文本 Transformers 英語
Q
JackChew
842
4
Sk Invoice Receipts
Apache-2.0
基於Donut架構微調的實驗性模型,專用於將發票或收據圖像轉換為XML或JSON數據結構,無需傳統OCR引擎。
圖像生成文本 Transformers
S
selvakumarcts
201
39
Invoice And Receipts Donut V1
Apache-2.0
基於Donut架構的大型語言模型,專為發票和收據圖像轉換為結構化數據而設計
圖像生成文本 Transformers
I
mychen76
2,945
54
Tatr Tab Struct V2
基於PubTables1M和FinTabNet數據集訓練的DETR架構模型,專用於表格結構識別任務
文字識別 Transformers
T
deepdoctection
99
2
Layout Xlm Base Finetuned With DocLayNet Base At Linelevel Ml384
MIT
基於LayoutXLM基礎模型在DocLayNet數據集上微調的行級別文檔理解模型,支持多語言文檔佈局分析和標記分類。
文字識別 Transformers 支持多種語言
L
pierreguillou
103
3
Lilt Xlm Roberta Base Finetuned With DocLayNet Base At Paragraphlevel Ml512
MIT
這是一個文檔理解模型,專門用於分析文檔佈局和內容,在段落級別進行標記分類任務。
文字識別 Transformers 支持多種語言
L
pierreguillou
126
3
Lilt Xlm Roberta Base Finetuned With DocLayNet Base At Linelevel Ml384
MIT
基於LiLT和DocLayNet數據集微調的行級別文檔理解模型,支持多語言文檔佈局分析
圖像生成文本 Transformers 支持多種語言
L
pierreguillou
700
12
Donut Base Payslips
MIT
基於Donut架構的文檔理解模型,專門針對工資單圖像處理進行微調
文字識別 Transformers
D
Assadullah
20
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase