SpaceThinker-Qwen2.5VL-3B-i1-GGUFオープンソース多モーダルモデル

ホーム

Spacethinker Qwen2.5VL 3B I1 GGUF

mradermacherによって開発

SpaceThinker-Qwen2.5VL-3B は、空間推論と視覚的質問応答タスクに特化したマルチモーダル視覚言語モデルです。

テキスト生成画像英語オープンソースライセンス:Apache-2.0 #マルチモーダル空間推論 #視覚的質問応答合成 #低リソース量子化展開

ダウンロード数 593

リリース時間 : 4/18/2025

モデル概要

このモデルはQwen2.5VLアーキテクチャを基にしており、空間推論、距離推定、視覚的質問応答などのタスク向けに設計されており、ロボティクスや具現化人工知能分野に適しています。

モデル特徴

マルチモーダル能力

視覚と言語入力を同時に処理し、クロスモーダル理解を実現

空間推論

距離推定などのタスクを含む、特別に最適化された定量的空間推論能力

効率的な量子化

様々なハードウェア条件に対応するため、複数の量子化バージョンを提供

推論時計算

複雑な計算や思考を推論プロセス中にサポート

モデル能力

視覚的質問応答

空間推論

距離推定

マルチモーダル理解

画像分析

テキスト生成

使用事例

ロボティクス

環境空間理解

ロボットが周囲環境の空間関係を理解するのを支援

ナビゲーションと物体操作の精度向上

教育

視覚的質問応答システム

画像内容に関する複雑な質問に回答

インタラクティブな学習体験の強化

🚀 SpaceThinker-Qwen2.5VL-3B の概要

SpaceThinker-Qwen2.5VL-3B は、多様な空間推論やマルチモーダルタスクに対応したモデルです。このREADMEでは、モデルの使用方法や提供される量子化データについて説明します。

📚 詳細情報

プロパティ	詳細
モデルタイプ	SpaceThinker-Qwen2.5VL-3B
ベースモデル	remyxai/SpaceThinker-Qwen2.5VL-3B
データセット	remyxai/SpaceThinker
言語	en
ライブラリ名	transformers
ライセンス	apache-2.0
量子化担当者	mradermacher
タグ	remyx, qwen2.5-vl, spatial-reasoning, multimodal, vlm, vqasynth, thinking, reasoning, test-time-compute, robotics, embodied-ai, quantitative-spatial-reasoning, distance-estimation, visual-question-answering

🚀 クイックスタート

概要

https://huggingface.co/remyxai/SpaceThinker-Qwen2.5VL-3B の重み付き/imatrix量子化データについてです。静的量子化データは https://huggingface.co/mradermacher/SpaceThinker-Qwen2.5VL-3B-GGUF で入手できます。

使用方法

GGUFファイルの使用方法がわからない場合は、TheBloke's READMEs を参照してください。ここには、マルチパートファイルの結合方法も含まれています。

📦 提供される量子化データ

（サイズ順に並べられており、必ずしも品質を表しているわけではありません。IQ量子化は同サイズの非IQ量子化よりも優れていることが多いです。）

リンク	タイプ	サイズ (GB)	備考
GGUF	i1-IQ1_S	0.9	非常に必要な場合
GGUF	i1-IQ1_M	1.0	ほとんど必要な場合
GGUF	i1-IQ2_XXS	1.0
GGUF	i1-IQ2_XS	1.1
GGUF	i1-IQ2_M	1.2
GGUF	i1-Q2_K_S	1.3	非常に低品質
GGUF	i1-Q2_K	1.4	IQ3_XXS の方が良い可能性があります
GGUF	i1-IQ3_XXS	1.4	低品質
GGUF	i1-IQ3_XS	1.5
GGUF	i1-Q3_K_S	1.6	IQ3_XS の方が良い可能性があります
GGUF	i1-IQ3_S	1.6	Q3_K* より優れています
GGUF	i1-IQ3_M	1.6
GGUF	i1-Q3_K_M	1.7	IQ3_S の方が良い可能性があります
GGUF	i1-Q3_K_L	1.8	IQ3_M の方が良い可能性があります
GGUF	i1-IQ4_XS	1.8
GGUF	i1-IQ4_NL	1.9	IQ4_XS を選ぶことをおすすめします
GGUF	i1-Q4_0	1.9	高速で低品質
GGUF	i1-Q4_K_S	1.9	サイズ/速度/品質のバランスが良い
GGUF	i1-Q4_K_M	2.0	高速でおすすめ
GGUF	i1-Q4_1	2.1
GGUF	i1-Q5_K_S	2.3
GGUF	i1-Q5_K_M	2.3
GGUF	i1-Q6_K	2.6	静的Q6_Kに近い

ikawrakowによる低品質量子化タイプの比較グラフです（値が低いほど良い）。

また、Artefact2によるこの問題に関する考え方はこちらです。 https://gist.github.com/Artefact2/b5f810600771265fc1e39442288e8ec9

📄 よくある質問 / モデルリクエスト

質問に対する回答や他のモデルの量子化を希望する場合は、https://huggingface.co/mradermacher/model_requests を参照してください。

🙏 謝辞

この作業を可能にするために、私の会社 nethype GmbH にサーバーの使用を許可していただき、ワークステーションのアップグレードを提供していただきました。また、@nicoboss には、私が多くのimatrix量子化データをより高品質で提供できるように、彼のプライベートスーパーコンピューターへのアクセスを許可していただきました。この場を借りて感謝申し上げます。