# 金融文档处理

Typhoon Ocr 7b
专为泰英双语现实场景文档解析打造的视觉语言模型,基于Qwen2.5-VL-Instruction框架
图像生成文本 Transformers 支持多种语言
T
scb10x
126
9
Qwen Vl 2.5 3B Finetuned Cheque
一款视觉语言模型,专门用于从支票图像中提取结构化的金融信息,生成包含支票号码、收款人、金额和签发日期等关键信息的JSON格式输出。
图像生成文本 Transformers 英语
Q
AJNG
170
1
Qwen2 VL 2B OCR
Apache-2.0
Qwen2-VL-2B-OCR是基于unsloth/Qwen2-VL-2B-Instruct微调的OCR模型,专注于从文档、表格和工资单图像中提取完整文本。
图像生成文本 Transformers 英语
Q
JackChew
842
4
Sk Invoice Receipts
Apache-2.0
基于Donut架构微调的实验性模型,专用于将发票或收据图像转换为XML或JSON数据结构,无需传统OCR引擎。
图像生成文本 Transformers
S
selvakumarcts
201
39
Invoice And Receipts Donut V1
Apache-2.0
基于Donut架构的大型语言模型,专为发票和收据图像转换为结构化数据而设计
图像生成文本 Transformers
I
mychen76
2,945
54
Tatr Tab Struct V2
基于PubTables1M和FinTabNet数据集训练的DETR架构模型,专用于表格结构识别任务
文字识别 Transformers
T
deepdoctection
99
2
Layout Xlm Base Finetuned With DocLayNet Base At Linelevel Ml384
MIT
基于LayoutXLM基础模型在DocLayNet数据集上微调的行级别文档理解模型,支持多语言文档布局分析和标记分类。
文字识别 Transformers 支持多种语言
L
pierreguillou
103
3
Lilt Xlm Roberta Base Finetuned With DocLayNet Base At Paragraphlevel Ml512
MIT
这是一个文档理解模型,专门用于分析文档布局和内容,在段落级别进行标记分类任务。
文字识别 Transformers 支持多种语言
L
pierreguillou
126
3
Lilt Xlm Roberta Base Finetuned With DocLayNet Base At Linelevel Ml384
MIT
基于LiLT和DocLayNet数据集微调的行级别文档理解模型,支持多语言文档布局分析
图像生成文本 Transformers 支持多种语言
L
pierreguillou
700
12
Donut Base Payslips
MIT
基于Donut架构的文档理解模型,专门针对工资单图像处理进行微调
文字识别 Transformers
D
Assadullah
20
0
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase