U

Udop Large 512 300k

由microsoft開發
UDOP是一個統一處理視覺、文本和佈局的通用文檔處理模型,基於T5架構,適用於文檔AI任務。
下載量 264
發布時間 : 2/26/2024

模型概述

UDOP採用基於T5的編碼器-解碼器Transformer架構,適用於文檔圖像分類、文檔解析和文檔視覺問答等文檔AI任務。

模型特點

統一多模態處理
能夠同時處理視覺、文本和佈局信息,實現全面的文檔理解
通用文檔AI能力
支持多種文檔AI任務,包括分類、解析和問答
基於T5架構
採用成熟的T5架構,具有良好的擴展性和適應性

模型能力

文檔圖像分類
文檔解析
文檔視覺問答
文本佈局理解
多模態文檔處理

使用案例

文檔處理
文檔圖像分類
自動識別和分類不同類型的文檔圖像
文檔解析
提取文檔中的結構化信息,如表格、字段等
文檔視覺問答
回答基於文檔內容的自然語言問題
示例中正確回答了表格上的日期問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase