Block Diagram Global Information
B
Block Diagram Global Information
由shreyanshu09開發
基於Donut框架的Transformer架構模型,用於從框圖圖像中提取整體摘要信息,支持英語和韓語處理。
下載量 19
發布時間 : 5/25/2024
模型概述
該模型採用Transformer編碼器-解碼器架構,專門用於處理框圖圖像並提取其全局信息。在ACL 2024會議論文中首次提出,適用於工程文檔、技術圖紙等場景的自動化信息提取。
模型特點
雙語言支持
同時支持英語和韓語框圖信息的提取與處理
局部-全局融合
採用創新的局部-全局信息融合技術,提高框圖理解的準確性
多源數據訓練
使用合成和真實框圖數據混合訓練,增強模型泛化能力
模型能力
框圖圖像理解
技術文檔信息提取
多語言文本生成
工程圖紙分析
使用案例
技術文檔處理
工程圖紙摘要生成
自動從工程框圖中提取關鍵組件和連接關係
生成結構化文本描述
技術文檔翻譯輔助
提取框圖信息後自動翻譯為目標語言
多語言技術文檔生成
教育應用
教學材料自動化處理
將手繪框圖轉換為結構化描述
輔助教學資源創建
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98