S

Spacethinker Qwen2.5VL 3B

由remyxai開發
SpaceThinker是一款通過測試時計算增強空間推理能力的多模態視覺語言模型,特別擅長定量空間推理和物體關係分析。
下載量 490
發布時間 : 4/17/2025

模型概述

基於Qwen2.5-VL-3B架構微調的視覺語言模型,專注於提升空間推理能力,適用於需要精確空間理解和規劃的具身AI應用。

模型特點

增強的空間推理能力
通過測試時計算增強對距離、大小和物體關係的定量推理能力
多模態理解
能夠同時處理圖像和文本輸入,進行復雜的視覺語言推理
具身AI優化
特別適合機器人、無人機等需要空間規劃和導航的應用場景

模型能力

定量空間推理
距離估計
物體關係分析
視覺問答
3D場景理解
多模態推理

使用案例

機器人導航
環境空間分析
幫助機器人理解周圍環境中物體的空間關係
提高導航和避障能力
無人機應用
空中距離估計
估計無人機與地面或空中物體的距離
提升飛行安全性和任務規劃能力
增強現實
虛擬物體放置
分析真實場景的空間特性來合理放置虛擬物體
提高AR體驗的真實感
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase