S

Spaceom GGUF

mgonzs13によって開発
SpaceOm-GGUFは、視覚質問応答タスクに特化したマルチモーダルモデルで、空間推論において優れた性能を発揮します。
ダウンロード数 196
リリース時間 : 6/11/2025

モデル概要

SpaceOm-GGUFは特定のデータセットを基に訓練されたマルチモーダルモデルで、視覚質問応答と空間推論タスクに長け、画像とテキストの変換に利用できます。

モデル特徴

強化された空間推論能力
SpaceThinkerをベースに改良され、より長い推論軌跡での訓練により空間理解能力を向上させました。
ロボット分野向け最適化
Robo2VLM - Reasoningデータセットを用いて訓練され、ロボットのアプリケーションシナリオでの性能を強化します。
マルチモーダル融合
視覚と言語処理能力を組み合わせ、高品質な画像テキスト変換を実現します。

モデル能力

視覚質問応答
空間推論
画像記述生成
目標物の位置特定
空間関係の理解
距離推定

使用事例

ロボットナビゲーション
空間環境の理解
ロボットが周囲環境の空間レイアウトを理解するのを支援します。
SpatialScoreベンチマークテストで目標物の位置特定スコアが54.00です。
教育
視覚質問応答システム
画像内容に関する複雑な空間問題に回答します。
SpaCE - 10ベンチマークテストで目標物 - 目標物の空間関係スコアが50.00です。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase