S

Spaceqwen2.5 VL 3B Instruct

由remyxai開發
基於Qwen2.5-VL-3B-Instruct微調的多模態視覺語言模型,專注於空間推理能力
下載量 7,446
發布時間 : 1/29/2025

模型概述

該模型通過LoRA微調增強了空間推理能力,能夠處理與物體間空間關係相關的視覺問答任務,適用於機器人導航、具身智能等場景

模型特點

增強空間推理
通過合成數據訓練,專門優化了距離估計、方位判斷等空間推理能力
多模態理解
能夠同時處理圖像和文本輸入,理解視覺場景中的物體關係
輕量微調
採用LoRA方法進行高效微調,保持基礎模型能力的同時增加特定功能

模型能力

視覺問答
空間關係推理
距離估計
物體定位
多模態理解

使用案例

機器人導航
倉庫環境導航
幫助機器人理解倉庫環境中物體的空間關係
可準確回答關於物體位置和距離的問題
具身智能
環境交互
為具身智能體提供空間感知能力
使智能體能夠更好地與環境互動
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase