B

Block Diagram Global Information

shreyanshu09によって開発
Donutフレームワークに基づくTransformerアーキテクチャモデルで、ブロック図画像から全体の要約情報を抽出し、英語と韓国語の処理をサポートします。
ダウンロード数 19
リリース時間 : 5/25/2024

モデル概要

このモデルはTransformerエンコーダー-デコーダーアーキテクチャを採用し、ブロック図画像を処理してそのグローバル情報を抽出するために特別に設計されています。ACL 2024会議論文で初めて提案され、エンジニアリングドキュメントや技術図面などのシナリオでの自動情報抽出に適しています。

モデル特徴

二言語サポート
英語と韓国語のブロック図情報の抽出と処理を同時にサポート
局所的-大域的融合
革新的な局所的-大域的融合技術を採用し、ブロック図理解の精度を向上
多様なデータトレーニング
合成データと実データの混合トレーニングにより、モデルの汎化能力を強化

モデル能力

ブロック図画像理解
技術文書情報抽出
多言語テキスト生成
エンジニアリング図面分析

使用事例

技術文書処理
エンジニアリング図面要約生成
エンジニアリングブロック図から主要コンポーネントと接続関係を自動抽出
構造化されたテキスト記述を生成
技術文書翻訳支援
ブロック図情報を抽出後、自動的に目標言語に翻訳
多言語技術文書生成
教育応用
教材自動処理
手描きブロック図を構造化記述に変換
教育リソース作成を支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase