Spaceqwen2.5 VL 3B Instruct GGUF
SpaceQwen2.5-VL-3B-Instruct は空間推論とエンボディドAIタスクに特化したマルチモーダル視覚言語モデルです。
Downloads 282
Release Time : 4/11/2025
Model Overview
このモデルはQwenアーキテクチャを基にしており、視覚と言語の理解能力を備え、特に空間推論、距離推定、ロボット技術に関連するタスクの処理に優れています。
Model Features
マルチモーダル能力
視覚と言語入力を同時に処理し、クロスモーダル理解を実現
空間推論
空間関係と距離推定タスクの処理に特化して最適化
量子化サポート
様々な量子化バージョンを提供し、異なるハードウェア要件に対応
ロボット技術応用
エンボディドAIとロボットナビゲーション関連タスクに適応
Model Capabilities
視覚質問応答
画像理解
空間関係推論
距離推定
マルチモーダル推論
ロボットナビゲーション支援
Use Cases
ロボット技術
環境ナビゲーション
ロボットが環境の空間関係を理解してナビゲーションするのを支援
拡張現実
空間アノテーション
現実環境における物体の空間関係を識別・注釈
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム Chinese
R
uer
2,694
98