D

Diagram2graph Adapters

zackriyaによって開発
画像から構造化データ(JSON)を抽出することに特化した視覚言語モデルで、特に図表内のノード、エッジ、およびそれらのサブ属性を識別し、視覚情報を知識グラフとして表現するのに優れています。
ダウンロード数 52
リリース時間 : 3/14/2025

モデル概要

このモデルはQwen2.5-VL-3B-Instructをファインチューニングしており、フローやフローチャートの視覚的表現から構造化データを抽出し、JSON形式で出力することに特化しています。

モデル特徴

構造化データ抽出
図表画像からノード、エッジ、およびそれらの属性を正確に抽出し、構造化されたJSON形式で出力することができます
LoRAファインチューニング最適化
LoRAベースの最適化技術を採用してファインチューニングを行い、モデルの性能を向上させています
知識グラフ表現
視覚情報を知識グラフ形式に変換し、後続の分析や処理を容易にします

モデル能力

図表画像分析
構造化データ抽出
JSON形式出力
知識グラフ構築

使用事例

図表分析
フローチャート解析
フローチャートからノードとエッジの構造化情報を抽出します
ノード検出が14%向上、エッジ検出が23%向上
BPMN分析
BPMN図表の自動処理と分析をサポートします
ドキュメント処理
自動化ドキュメント処理
ドキュメント内の図表から構造化データを抽出します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase