S

Spatialbot 3B

由RussRobin開發
SpatialBot是一款具備空間理解與推理能力的視覺語言模型,能精準解析深度圖並執行高級任務。
下載量 301
發布時間 : 7/17/2024

模型概述

基於Phi-2和SigLIP架構開發的融合版視覺語言模型,在常規視覺語言任務及空間理解基準測試中表現優異。

模型特點

空間理解能力
能夠精準解析深度圖並進行空間推理
多模態處理
同時處理視覺和語言輸入,實現跨模態理解
高效架構
基於Phi-2和SigLIP的高效架構設計

模型能力

深度圖解析
空間推理
視覺問答
多模態理解

使用案例

空間理解
深度值查詢
從深度圖中讀取指定座標點的深度值
精確返回深度數值
空間關係推理
分析場景中物體的空間位置關係
生成準確的空間描述
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase