S

Spatialbot 3B

Developed by RussRobin
SpatialBot是一款具备空间理解与推理能力的视觉语言模型,能精准解析深度图并执行高级任务。
Downloads 301
Release Time : 7/17/2024

Model Overview

基于Phi-2和SigLIP架构开发的融合版视觉语言模型,在常规视觉语言任务及空间理解基准测试中表现优异。

Model Features

空间理解能力
能够精准解析深度图并进行空间推理
多模态处理
同时处理视觉和语言输入,实现跨模态理解
高效架构
基于Phi-2和SigLIP的高效架构设计

Model Capabilities

深度图解析
空间推理
视觉问答
多模态理解

Use Cases

空间理解
深度值查询
从深度图中读取指定坐标点的深度值
精确返回深度数值
空间关系推理
分析场景中物体的空间位置关系
生成准确的空间描述
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase