🚀 SpaceThinker-Qwen2.5VL-3B量化模型
SpaceThinker-Qwen2.5VL-3B量化模型基於transformers
庫,支持多模態處理,可用於空間推理、視覺問答等多種場景。該模型提供了多種量化版本,方便不同需求的用戶使用。
📚 詳細文檔
模型信息
屬性 |
詳情 |
基礎模型 |
remyxai/SpaceThinker-Qwen2.5VL-3B |
數據集 |
remyxai/SpaceThinker |
語言 |
en |
庫名稱 |
transformers |
許可證 |
apache - 2.0 |
量化者 |
mradermacher |
標籤 |
remyx、qwen2.5 - vl、spatial - reasoning、multimodal、vlm、vqasynth、thinking、reasoning、test - time - compute、robotics、embodied - ai、quantitative - spatial - reasoning、distance - estimation、visual - question - answering |
關於模型
https://huggingface.co/remyxai/SpaceThinker-Qwen2.5VL-3B 的加權/矩陣量化版本。靜態量化文件可在 https://huggingface.co/mradermacher/SpaceThinker-Qwen2.5VL-3B-GGUF 獲取。
使用說明
如果您不確定如何使用 GGUF 文件,請參考 TheBloke 的 README 以獲取更多詳細信息,包括如何拼接多部分文件。
提供的量化版本
(按大小排序,不一定按質量排序。IQ 量化通常比類似大小的非 IQ 量化更可取)
鏈接 |
類型 |
大小/GB |
備註 |
GGUF |
i1 - IQ1_S |
0.9 |
適用於資源極度緊張的情況 |
GGUF |
i1 - IQ1_M |
1.0 |
多數情況下適用於資源緊張的情況 |
GGUF |
i1 - IQ2_XXS |
1.0 |
|
GGUF |
i1 - IQ2_XS |
1.1 |
|
GGUF |
i1 - IQ2_S |
1.2 |
|
GGUF |
i1 - IQ2_M |
1.2 |
|
GGUF |
i1 - Q2_K_S |
1.3 |
質量非常低 |
GGUF |
i1 - Q2_K |
1.4 |
IQ3_XXS 可能更好 |
GGUF |
i1 - IQ3_XXS |
1.4 |
質量較低 |
GGUF |
i1 - IQ3_XS |
1.5 |
|
GGUF |
i1 - Q3_K_S |
1.6 |
IQ3_XS 可能更好 |
GGUF |
i1 - IQ3_S |
1.6 |
優於 Q3_K* |
GGUF |
i1 - IQ3_M |
1.6 |
|
GGUF |
i1 - Q3_K_M |
1.7 |
IQ3_S 可能更好 |
GGUF |
i1 - Q3_K_L |
1.8 |
IQ3_M 可能更好 |
GGUF |
i1 - IQ4_XS |
1.8 |
|
GGUF |
i1 - IQ4_NL |
1.9 |
優先選擇 IQ4_XS |
GGUF |
i1 - Q4_0 |
1.9 |
速度快,質量低 |
GGUF |
i1 - Q4_K_S |
1.9 |
大小/速度/質量最優 |
GGUF |
i1 - Q4_K_M |
2.0 |
速度快,推薦使用 |
GGUF |
i1 - Q4_1 |
2.1 |
|
GGUF |
i1 - Q5_K_S |
2.3 |
|
GGUF |
i1 - Q5_K_M |
2.3 |
|
GGUF |
i1 - Q6_K |
2.6 |
實際上類似於靜態 Q6_K |
以下是 ikawrakow 提供的一個比較一些低質量量化類型的實用圖表(數值越低越好):

此外,您還可以參考 Artefact2 對此事的看法:https://gist.github.com/Artefact2/b5f810600771265fc1e39442288e8ec9
常見問題解答/模型請求
有關您可能遇到的問題的答案,以及如果您希望對其他模型進行量化,請訪問 https://huggingface.co/mradermacher/model_requests。
致謝
感謝我的公司 nethype GmbH 允許我使用其服務器,並對我的工作站進行升級,使我能夠在業餘時間完成這項工作。此外,感謝 @nicoboss 讓我使用他的私人超級計算機,使我能夠提供更多、質量更高的矩陣量化版本。
📄 許可證
本模型使用的許可證為 apache - 2.0。