S

Spaceqwen2.5 VL 3B Instruct GGUF

Developed by mradermacher
SpaceQwen2.5-VL-3B-Instruct は空間推論とエンボディドAIタスクに特化したマルチモーダル視覚言語モデルです。
Downloads 282
Release Time : 4/11/2025

Model Overview

このモデルはQwenアーキテクチャを基にしており、視覚と言語の理解能力を備え、特に空間推論、距離推定、ロボット技術に関連するタスクの処理に優れています。

Model Features

マルチモーダル能力
視覚と言語入力を同時に処理し、クロスモーダル理解を実現
空間推論
空間関係と距離推定タスクの処理に特化して最適化
量子化サポート
様々な量子化バージョンを提供し、異なるハードウェア要件に対応
ロボット技術応用
エンボディドAIとロボットナビゲーション関連タスクに適応

Model Capabilities

視覚質問応答
画像理解
空間関係推論
距離推定
マルチモーダル推論
ロボットナビゲーション支援

Use Cases

ロボット技術
環境ナビゲーション
ロボットが環境の空間関係を理解してナビゲーションするのを支援
拡張現実
空間アノテーション
現実環境における物体の空間関係を識別・注釈
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase