金融文档处理

# 金融文档处理

专为泰英双语现实场景文档解析打造的视觉语言模型，基于Qwen2.5-VL-Instruction框架

图像生成文本

Transformers 支持多种语言

Qwen Vl 2.5 3B Finetuned Cheque

一款视觉语言模型，专门用于从支票图像中提取结构化的金融信息，生成包含支票号码、收款人、金额和签发日期等关键信息的JSON格式输出。

图像生成文本

Transformers 英语

Qwen2 VL 2B OCR

Qwen2-VL-2B-OCR是基于unsloth/Qwen2-VL-2B-Instruct微调的OCR模型，专注于从文档、表格和工资单图像中提取完整文本。

图像生成文本

Transformers 英语

Sk Invoice Receipts

基于Donut架构微调的实验性模型，专用于将发票或收据图像转换为XML或JSON数据结构，无需传统OCR引擎。

图像生成文本

Invoice And Receipts Donut V1

基于Donut架构的大型语言模型，专为发票和收据图像转换为结构化数据而设计

图像生成文本

Tatr Tab Struct V2

基于PubTables1M和FinTabNet数据集训练的DETR架构模型，专用于表格结构识别任务

Layout Xlm Base Finetuned With DocLayNet Base At Linelevel Ml384

基于LayoutXLM基础模型在DocLayNet数据集上微调的行级别文档理解模型，支持多语言文档布局分析和标记分类。

Transformers 支持多种语言

Lilt Xlm Roberta Base Finetuned With DocLayNet Base At Paragraphlevel Ml512

这是一个文档理解模型，专门用于分析文档布局和内容，在段落级别进行标记分类任务。

Transformers 支持多种语言

Lilt Xlm Roberta Base Finetuned With DocLayNet Base At Linelevel Ml384

基于LiLT和DocLayNet数据集微调的行级别文档理解模型，支持多语言文档布局分析

图像生成文本

Transformers 支持多种语言

Donut Base Payslips

基于Donut架构的文档理解模型，专门针对工资单图像处理进行微调

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase