E

Euclid Convnext Xxlarge 120524

euclid-multimodalによって開発
低レベルの幾何知覚能力を強化するために特別に訓練されたマルチモーダル大規模言語モデル。高忠実度の視覚記述を合成することで幾何解析能力を向上
ダウンロード数 22
リリース時間 : 12/3/2024

モデル概要

ConvNeXt視覚エンコーダーとQwen-2.5言語モデルを組み合わせたマルチモーダルモデル。160万枚の合成幾何画像とQAペアで訓練され、正確な幾何関係検出と分析に優れる

モデル特徴

高忠実度幾何知覚
合成幾何画像と精密に注釈付けされたQAペアで訓練され、ミリメートルレベルの幾何関係認識を実現
カリキュラム学習アーキテクチャ
単純な幾何要素から複雑な関係へと段階的にモデル能力を向上させる漸進的訓練戦略を採用
マルチモーダル融合
ConvNeXt視覚特徴と言語モデルを2層MLPで効率的に整合させる革新的手法

モデル能力

点線関係検出
点円関係検出
角度分類
長さ比較
幾何注釈理解
幾何証明検証
幾何等式求解

使用事例

工業検査
機械部品寸法測定
部品図面中の主要寸法関係を自動検出
長さ比較タスクで90.82%の精度を達成
医療画像
解剖構造分析
医療画像中の臓器幾何特徴を識別
教育技術
幾何証明補助
学生が提出した幾何証明ステップを検証
証明検証タスクで70.52%の精度を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase