D

Dit Doclaynet

jzjuによって開発
DITアーキテクチャに基づく文書画像分割モデルで、文書内の異なる要素タイプを識別・分割するために特別に設計されています。
ダウンロード数 2,527
リリース時間 : 3/28/2024

モデル概要

このモデルはBEiTアーキテクチャに基づいており、文書画像分割タスク向けに最適化されており、図表注釈、脚注、数式など11種類の異なる文書要素タイプを識別できます。

モデル特徴

文書要素の精密分割
11種類の異なる文書要素を正確に識別・分割できます
DITアーキテクチャベース
BEiT/DITビジョントランスフォーマーアーキテクチャを採用し、強力な特徴抽出能力を備えています
専門データセットでのトレーニング
DocLayNet-v1.1専門文書データセットでトレーニングされ、文書分析向けに最適化されています

モデル能力

文書画像分割
多クラス要素識別
文書構造分析

使用事例

文書デジタル化
PDF文書解析
PDF文書内の異なる要素領域を自動識別
文書のデジタル化と構造化の効率を向上
学術論文分析
論文内の数式、図表、章構成を抽出
学術文献の自動処理と索引付けを容易に
オフィスオートメーション
契約書処理
契約書内の本文、見出し、署名領域を自動識別
契約審査と管理プロセスを加速
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase