S

Spacethinker Qwen2.5VL 3B

Developed by remyxai
SpaceThinkerは、テスト時計算増強により空間推論能力を強化したマルチモーダル視覚言語モデルで、特に定量的空間推論と物体関係分析に優れています。
Downloads 490
Release Time : 4/17/2025

Model Overview

Qwen2.5-VL-3Bアーキテクチャをファインチューニングした視覚言語モデルで、正確な空間理解と計画が必要なエンボディドAIアプリケーションに適しています。

Model Features

強化された空間推論能力
テスト時計算増強により、距離、サイズ、物体関係の定量的推論能力を強化
マルチモーダル理解
画像とテキスト入力を同時に処理し、複雑な視覚言語推論が可能
エンボディドAI最適化
ロボットやドローンなど、空間計画とナビゲーションが必要なアプリケーションに特に適しています

Model Capabilities

定量的空間推論
距離推定
物体関係分析
視覚質問応答
3Dシーン理解
マルチモーダル推論

Use Cases

ロボットナビゲーション
環境空間分析
ロボットが周囲環境の物体間の空間関係を理解するのを支援
ナビゲーションと障害物回避能力の向上
ドローンアプリケーション
空中距離推定
ドローンと地上または空中物体間の距離を推定
飛行安全性と任務計画能力の向上
拡張現実
仮想物体配置
実シーンの空間特性を分析して仮想物体を適切に配置
AR体験のリアリズム向上
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase