B

Block Diagram Global Information

由shreyanshu09開發
基於Donut框架的Transformer架構模型,用於從框圖圖像中提取整體摘要信息,支持英語和韓語處理。
下載量 19
發布時間 : 5/25/2024

模型概述

該模型採用Transformer編碼器-解碼器架構,專門用於處理框圖圖像並提取其全局信息。在ACL 2024會議論文中首次提出,適用於工程文檔、技術圖紙等場景的自動化信息提取。

模型特點

雙語言支持
同時支持英語和韓語框圖信息的提取與處理
局部-全局融合
採用創新的局部-全局信息融合技術,提高框圖理解的準確性
多源數據訓練
使用合成和真實框圖數據混合訓練,增強模型泛化能力

模型能力

框圖圖像理解
技術文檔信息提取
多語言文本生成
工程圖紙分析

使用案例

技術文檔處理
工程圖紙摘要生成
自動從工程框圖中提取關鍵組件和連接關係
生成結構化文本描述
技術文檔翻譯輔助
提取框圖信息後自動翻譯為目標語言
多語言技術文檔生成
教育應用
教學材料自動化處理
將手繪框圖轉換為結構化描述
輔助教學資源創建
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase