D

Dit Doclaynet

Developed by jzju
基於DIT架構的文檔圖像分割模型,專門用於識別和分割文檔中的不同元素類型。
Downloads 2,527
Release Time : 3/28/2024

Model Overview

該模型基於BEiT架構,針對文檔圖像分割任務進行了優化,能夠識別11種不同的文檔元素類型,如圖注、腳註、公式等。

Model Features

文檔元素精確分割
能夠準確識別和分割11種不同類型的文檔元素
基於DIT架構
採用BEiT/DIT視覺變換器架構,具有強大的特徵提取能力
專業數據集訓練
在DocLayNet-v1.1專業文檔數據集上訓練,針對文檔分析優化

Model Capabilities

文檔圖像分割
多類別元素識別
文檔結構分析

Use Cases

文檔數字化
PDF文檔解析
自動識別PDF文檔中的不同元素區域
提高文檔數字化和結構化的效率
學術論文分析
提取論文中的公式、圖表和章節結構
便於學術文獻的自動處理和索引
辦公自動化
合同文檔處理
自動識別合同中的正文、標題和簽名區域
加速合同審查和管理流程
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase