U

Udop Large 512

microsoftによって開発
UDOPは視覚、テキスト、レイアウトを統合した汎用文書処理モデルで、T5アーキテクチャに基づき、文書画像分類、解析、視覚質問応答などのタスクに適しています。
ダウンロード数 193
リリース時間 : 2/26/2024

モデル概要

UDOPはT5ベースのエンコーダー-デコーダーTransformerアーキテクチャを採用し、視覚、テキスト、レイアウト情報を統合して文書AIタスクを処理します。

モデル特徴

マルチモーダル統合処理
視覚、テキスト、レイアウト情報を統合して共同処理
汎用文書処理
分類、解析、質問応答など多様な文書AIタスクをサポート
T5アーキテクチャベース
確立されたT5エンコーダー-デコーダーTransformerアーキテクチャを採用

モデル能力

文書画像分類
文書構造解析
文書視覚質問応答
文書意味理解

使用事例

文書処理
表データ抽出
文書画像から表データを抽出
出力例:9/30/92
文書分類
文書画像を分類
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase