D

Dit Doclaynet

由jzju開發
基於DIT架構的文檔圖像分割模型,專門用於識別和分割文檔中的不同元素類型。
下載量 2,527
發布時間 : 3/28/2024

模型概述

該模型基於BEiT架構,針對文檔圖像分割任務進行了優化,能夠識別11種不同的文檔元素類型,如圖注、腳註、公式等。

模型特點

文檔元素精確分割
能夠準確識別和分割11種不同類型的文檔元素
基於DIT架構
採用BEiT/DIT視覺變換器架構,具有強大的特徵提取能力
專業數據集訓練
在DocLayNet-v1.1專業文檔數據集上訓練,針對文檔分析優化

模型能力

文檔圖像分割
多類別元素識別
文檔結構分析

使用案例

文檔數字化
PDF文檔解析
自動識別PDF文檔中的不同元素區域
提高文檔數字化和結構化的效率
學術論文分析
提取論文中的公式、圖表和章節結構
便於學術文獻的自動處理和索引
辦公自動化
合同文檔處理
自動識別合同中的正文、標題和簽名區域
加速合同審查和管理流程
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase