E

Euclid Convnext Xxlarge 120524

由euclid-multimodal開發
專為強化低級幾何感知能力訓練的多模態大語言模型,通過合成高保真視覺描述增強幾何分析能力
下載量 22
發布時間 : 12/3/2024

模型概述

結合ConvNeXt視覺編碼器與Qwen-2.5語言模型的多模態模型,在160萬張合成幾何圖像及問答對上訓練,擅長精確的幾何關係檢測和分析

模型特點

高保真幾何感知
通過合成幾何圖像和精確標註的問答對訓練,實現毫米級幾何關係識別
課程學習架構
採用漸進式訓練策略,從簡單幾何元素到複雜關係逐步提升模型能力
多模態融合
創新性地將ConvNeXt視覺特徵與語言模型通過雙層MLP進行高效對齊

模型能力

點線關係檢測
點圓關係檢測
角度分類
長度比較
幾何標註理解
幾何證明驗證
幾何等式求解

使用案例

工業檢測
機械零件尺寸測量
自動檢測零件圖紙中的關鍵尺寸關係
在長度比較任務中達到90.82%準確率
醫療影像
解剖結構分析
識別醫學影像中的器官幾何特徵
教育科技
幾何證明輔助
驗證學生提交的幾何證明步驟
在證明驗證任務中達到70.52%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase