Dit Doclaynet
D
Dit Doclaynet
jzjuによって開発
DITアーキテクチャに基づく文書画像分割モデルで、文書内の異なる要素タイプを識別・分割するために特別に設計されています。
ダウンロード数 2,527
リリース時間 : 3/28/2024
モデル概要
このモデルはBEiTアーキテクチャに基づいており、文書画像分割タスク向けに最適化されており、図表注釈、脚注、数式など11種類の異なる文書要素タイプを識別できます。
モデル特徴
文書要素の精密分割
11種類の異なる文書要素を正確に識別・分割できます
DITアーキテクチャベース
BEiT/DITビジョントランスフォーマーアーキテクチャを採用し、強力な特徴抽出能力を備えています
専門データセットでのトレーニング
DocLayNet-v1.1専門文書データセットでトレーニングされ、文書分析向けに最適化されています
モデル能力
文書画像分割
多クラス要素識別
文書構造分析
使用事例
文書デジタル化
PDF文書解析
PDF文書内の異なる要素領域を自動識別
文書のデジタル化と構造化の効率を向上
学術論文分析
論文内の数式、図表、章構成を抽出
学術文献の自動処理と索引付けを容易に
オフィスオートメーション
契約書処理
契約書内の本文、見出し、署名領域を自動識別
契約審査と管理プロセスを加速
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98