U

Udop Large 512

由 microsoft 开发
UDOP是一个统一视觉、文本与布局的通用文档处理模型,基于T5架构,适用于文档图像分类、解析和视觉问答等任务。
下载量 193
发布时间 : 2/26/2024

模型简介

UDOP采用基于T5的编码器-解码器Transformer架构,整合视觉、文本和布局信息,用于处理文档AI任务。

模型特点

多模态统一处理
整合视觉、文本和布局信息进行联合处理
通用文档处理
支持多种文档AI任务,包括分类、解析和问答
基于T5架构
采用成熟的T5编码器-解码器Transformer架构

模型能力

文档图像分类
文档结构解析
文档视觉问答
文档语义理解

使用案例

文档处理
表格信息提取
从文档图像中提取表格数据
示例输出:9/30/92
文档分类
对文档图像进行分类
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase