🚀 SpaceThinker-Qwen2.5VL-3B量化模型
SpaceThinker-Qwen2.5VL-3B量化模型基于transformers
库,支持多模态处理,可用于空间推理、视觉问答等多种场景。该模型提供了多种量化版本,方便不同需求的用户使用。
📚 详细文档
模型信息
属性 |
详情 |
基础模型 |
remyxai/SpaceThinker-Qwen2.5VL-3B |
数据集 |
remyxai/SpaceThinker |
语言 |
en |
库名称 |
transformers |
许可证 |
apache - 2.0 |
量化者 |
mradermacher |
标签 |
remyx、qwen2.5 - vl、spatial - reasoning、multimodal、vlm、vqasynth、thinking、reasoning、test - time - compute、robotics、embodied - ai、quantitative - spatial - reasoning、distance - estimation、visual - question - answering |
关于模型
https://huggingface.co/remyxai/SpaceThinker-Qwen2.5VL-3B 的加权/矩阵量化版本。静态量化文件可在 https://huggingface.co/mradermacher/SpaceThinker-Qwen2.5VL-3B-GGUF 获取。
使用说明
如果您不确定如何使用 GGUF 文件,请参考 TheBloke 的 README 以获取更多详细信息,包括如何拼接多部分文件。
提供的量化版本
(按大小排序,不一定按质量排序。IQ 量化通常比类似大小的非 IQ 量化更可取)
链接 |
类型 |
大小/GB |
备注 |
GGUF |
i1 - IQ1_S |
0.9 |
适用于资源极度紧张的情况 |
GGUF |
i1 - IQ1_M |
1.0 |
多数情况下适用于资源紧张的情况 |
GGUF |
i1 - IQ2_XXS |
1.0 |
|
GGUF |
i1 - IQ2_XS |
1.1 |
|
GGUF |
i1 - IQ2_S |
1.2 |
|
GGUF |
i1 - IQ2_M |
1.2 |
|
GGUF |
i1 - Q2_K_S |
1.3 |
质量非常低 |
GGUF |
i1 - Q2_K |
1.4 |
IQ3_XXS 可能更好 |
GGUF |
i1 - IQ3_XXS |
1.4 |
质量较低 |
GGUF |
i1 - IQ3_XS |
1.5 |
|
GGUF |
i1 - Q3_K_S |
1.6 |
IQ3_XS 可能更好 |
GGUF |
i1 - IQ3_S |
1.6 |
优于 Q3_K* |
GGUF |
i1 - IQ3_M |
1.6 |
|
GGUF |
i1 - Q3_K_M |
1.7 |
IQ3_S 可能更好 |
GGUF |
i1 - Q3_K_L |
1.8 |
IQ3_M 可能更好 |
GGUF |
i1 - IQ4_XS |
1.8 |
|
GGUF |
i1 - IQ4_NL |
1.9 |
优先选择 IQ4_XS |
GGUF |
i1 - Q4_0 |
1.9 |
速度快,质量低 |
GGUF |
i1 - Q4_K_S |
1.9 |
大小/速度/质量最优 |
GGUF |
i1 - Q4_K_M |
2.0 |
速度快,推荐使用 |
GGUF |
i1 - Q4_1 |
2.1 |
|
GGUF |
i1 - Q5_K_S |
2.3 |
|
GGUF |
i1 - Q5_K_M |
2.3 |
|
GGUF |
i1 - Q6_K |
2.6 |
实际上类似于静态 Q6_K |
以下是 ikawrakow 提供的一个比较一些低质量量化类型的实用图表(数值越低越好):

此外,您还可以参考 Artefact2 对此事的看法:https://gist.github.com/Artefact2/b5f810600771265fc1e39442288e8ec9
常见问题解答/模型请求
有关您可能遇到的问题的答案,以及如果您希望对其他模型进行量化,请访问 https://huggingface.co/mradermacher/model_requests。
致谢
感谢我的公司 nethype GmbH 允许我使用其服务器,并对我的工作站进行升级,使我能够在业余时间完成这项工作。此外,感谢 @nicoboss 让我使用他的私人超级计算机,使我能够提供更多、质量更高的矩阵量化版本。
📄 许可证
本模型使用的许可证为 apache - 2.0。