S

Spaceom GGUF

由mgonzs13開發
SpaceOm-GGUF 是一款專注於視覺問答任務的多模態模型,在空間推理方面表現出色。
下載量 196
發布時間 : 6/11/2025

模型概述

SpaceOm-GGUF 是基於特定數據集訓練的多模態模型,擅長視覺問答和空間推理任務,可用於圖像文本轉換。

模型特點

增強的空間推理能力
在 SpaceThinker 基礎上改進,通過更長的推理軌跡訓練提升空間理解能力
機器人領域優化
使用 Robo2VLM-Reasoning 數據集訓練,增強機器人應用場景下的表現
多模態融合
結合視覺和語言處理能力,實現高質量的圖像文本轉換

模型能力

視覺問答
空間推理
圖像描述生成
目標定位
空間關係理解
距離估計

使用案例

機器人導航
空間環境理解
幫助機器人理解周圍環境的空間佈局
在 SpatialScore 基準測試中目標定位得分 54.00
教育
視覺問答系統
回答關於圖像內容的複雜空間問題
在 SpaCE-10 基準測試中目標-目標空間關係得分 50.00
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase