S

Spacethinker Qwen2.5VL 3B

remyxaiによって開発
SpaceThinkerは、テスト時計算増強により空間推論能力を強化したマルチモーダル視覚言語モデルで、特に定量的空間推論と物体関係分析に優れています。
ダウンロード数 490
リリース時間 : 4/17/2025

モデル概要

Qwen2.5-VL-3Bアーキテクチャをファインチューニングした視覚言語モデルで、正確な空間理解と計画が必要なエンボディドAIアプリケーションに適しています。

モデル特徴

強化された空間推論能力
テスト時計算増強により、距離、サイズ、物体関係の定量的推論能力を強化
マルチモーダル理解
画像とテキスト入力を同時に処理し、複雑な視覚言語推論が可能
エンボディドAI最適化
ロボットやドローンなど、空間計画とナビゲーションが必要なアプリケーションに特に適しています

モデル能力

定量的空間推論
距離推定
物体関係分析
視覚質問応答
3Dシーン理解
マルチモーダル推論

使用事例

ロボットナビゲーション
環境空間分析
ロボットが周囲環境の物体間の空間関係を理解するのを支援
ナビゲーションと障害物回避能力の向上
ドローンアプリケーション
空中距離推定
ドローンと地上または空中物体間の距離を推定
飛行安全性と任務計画能力の向上
拡張現実
仮想物体配置
実シーンの空間特性を分析して仮想物体を適切に配置
AR体験のリアリズム向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase