dit-doclaynetオープンソース文書画像分割モデル - 無料で文書の異なる要素タイプを識別・分割

ホーム

Dit Doclaynet

jzjuによって開発

DITアーキテクチャに基づく文書画像分割モデルで、文書内の異なる要素タイプを識別・分割するために特別に設計されています。

画像セグメンテーション

Transformers

#文書画像分割 #多クラス意味分割 #高精度レイアウト認識

ダウンロード数 2,527

リリース時間 : 3/28/2024

モデル概要

このモデルはBEiTアーキテクチャに基づいており、文書画像分割タスク向けに最適化されており、図表注釈、脚注、数式など11種類の異なる文書要素タイプを識別できます。

モデル特徴

文書要素の精密分割

11種類の異なる文書要素を正確に識別・分割できます

DITアーキテクチャベース

BEiT/DITビジョントランスフォーマーアーキテクチャを採用し、強力な特徴抽出能力を備えています

専門データセットでのトレーニング

DocLayNet-v1.1専門文書データセットでトレーニングされ、文書分析向けに最適化されています

モデル能力

文書画像分割

多クラス要素識別

文書構造分析

使用事例

文書デジタル化

PDF文書解析

PDF文書内の異なる要素領域を自動識別

文書のデジタル化と構造化の効率を向上

学術論文分析

論文内の数式、図表、章構成を抽出

学術文献の自動処理と索引付けを容易に

オフィスオートメーション

契約書処理

契約書内の本文、見出し、署名領域を自動識別

契約審査と管理プロセスを加速

属性	詳情
パイプラインタグ	画像セグメンテーション
タグ	Vision、Image-segmentation、DIT
データセット	ds4sd/DocLayNet-v1.1
トレーニングエポック数	4エポック

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Dit Doclaynet

モデル概要

モデル特徴

モデル能力

使用事例

🚀 トランスフォーマー

🚀 クイックスタート

💻 使用例

基本的な使用法

高度な使用法

📚 詳細情報

ラベル情報

情報テーブル