Mistral-Small-3.2-24B-Instruct-2506开源模型 - 多量化类型适配不同硬件需求

首页

Mistralai Mistral Small 3.2 24B Instruct 2506 GGUF

由 bartowski 开发

这是Mistral-Small-3.2-24B-Instruct-2506模型的Llamacpp imatrix量化版本，提供多种量化类型以满足不同硬件需求。

大型语言模型支持多种语言开源协议:Apache-2.0 #多语言指令模型 #高效量化部署 #低内存优化

下载量 3,769

发布时间 : 6/20/2025

模型简介

该项目提供了Mistral-Small-3.2-24B-Instruct-2506模型的不同量化版本，旨在优化模型在不同硬件上的运行效率和性能。

模型特点

多种量化类型

提供了丰富的量化类型，如bf16、Q8_0、Q6_K_L等，用户可根据需求选择不同的量化文件。

性能优化

部分量化文件通过将嵌入和输出权重量化为Q8_0，提高了模型的性能和质量。

在线重打包

部分量化文件支持在线重打包，可自动优化硬件性能。

模型能力

文本生成

多语言支持

量化模型优化

使用案例

文本生成

多语言文本生成

支持多种语言的文本生成任务。

模型优化

硬件性能优化

通过量化优化模型在不同硬件上的运行效率。

🚀 Mistral-Small-3.2-24B-Instruct-2506的Llamacpp imatrix量化版本

本项目是对Mistral-Small-3.2-24B-Instruct-2506模型进行的Llamacpp imatrix量化处理，旨在提供不同量化类型的模型文件，以满足不同硬件和性能需求。用户可以根据自身设备的内存和性能选择合适的量化文件，并在LM Studio或基于llama.cpp的项目中运行。

🔍 项目信息

属性	详情
量化者	bartowski
任务类型	图像文本到文本
支持语言	英语、法语、德语、西班牙语、葡萄牙语、意大利语、日语、韩语、俄语、中文、阿拉伯语、波斯语、印尼语、马来语、尼泊尔语、波兰语、罗马尼亚语、塞尔维亚语、瑞典语、土耳其语、乌克兰语、越南语、印地语、孟加拉语
基础模型	mistralai/Mistral-Small-3.2-24B-Instruct-2506
基础模型关系	量化版本
许可证	Apache-2.0
推理功能	否

⚠️ 重要提示

如果你想了解我们如何处理你的个人数据，请阅读我们的隐私政策。

🚀 快速开始

运行方式

LM Studio：可在 LM Studio 中运行量化后的模型。
llama.cpp：直接使用 llama.cpp 或任何基于llama.cpp的项目运行。

提示格式

<s>[SYSTEM_PROMPT]{system_prompt}[/SYSTEM_PROMPT][INST]{prompt}[/INST]

✨ 主要特性

多种量化类型：提供了丰富的量化类型，如bf16、Q8_0、Q6_K_L等，用户可根据需求选择不同的量化文件。
在线重打包：部分量化文件支持在线重打包，可自动优化硬件性能。
性能优化：部分量化文件通过将嵌入和输出权重量化为Q8_0，提高了模型的性能和质量。

📦 安装指南

安装huggingface-cli

pip install -U "huggingface_hub[cli]"

下载单个文件

huggingface-cli download bartowski/mistralai_Mistral-Small-3.2-24B-Instruct-2506-GGUF --include "mistralai_Mistral-Small-3.2-24B-Instruct-2506-Q4_K_M.gguf" --local-dir ./

下载拆分文件

如果模型大于50GB，已拆分为多个文件，可使用以下命令下载到本地文件夹：

huggingface-cli download bartowski/mistralai_Mistral-Small-3.2-24B-Instruct-2506-GGUF --include "mistralai_Mistral-Small-3.2-24B-Instruct-2506-Q8_0/*" --local-dir ./

💻 使用示例

基础用法

在LM Studio中，选择下载的量化文件即可开始使用。

高级用法

使用llama.cpp直接运行模型，可根据需求调整参数，以获得更好的性能和效果。

📚 详细文档

下载文件列表

文件名	量化类型	文件大小	拆分	描述
Mistral-Small-3.2-24B-Instruct-2506-bf16.gguf	bf16	47.15GB	否	完整的BF16权重。
Mistral-Small-3.2-24B-Instruct-2506-Q8_0.gguf	Q8_0	25.05GB	否	极高质量，通常不需要，但为最大可用量化。
Mistral-Small-3.2-24B-Instruct-2506-Q6_K_L.gguf	Q6_K_L	19.67GB	否	嵌入和输出权重使用Q8_0。非常高质量，接近完美，推荐。
Mistral-Small-3.2-24B-Instruct-2506-Q6_K.gguf	Q6_K	19.35GB	否	非常高质量，接近完美，推荐。
Mistral-Small-3.2-24B-Instruct-2506-Q5_K_L.gguf	Q5_K_L	17.18GB	否	嵌入和输出权重使用Q8_0。高质量，推荐。
Mistral-Small-3.2-24B-Instruct-2506-Q5_K_M.gguf	Q5_K_M	16.76GB	否	高质量，推荐。
Mistral-Small-3.2-24B-Instruct-2506-Q5_K_S.gguf	Q5_K_S	16.30GB	否	高质量，推荐。
Mistral-Small-3.2-24B-Instruct-2506-Q4_1.gguf	Q4_1	14.87GB	否	旧格式，性能与Q4_K_S相似，但在Apple硅芯片上提高了每瓦令牌数。
Mistral-Small-3.2-24B-Instruct-2506-Q4_K_L.gguf	Q4_K_L	14.83GB	否	嵌入和输出权重使用Q8_0。质量良好，推荐。
Mistral-Small-3.2-24B-Instruct-2506-Q4_K_M.gguf	Q4_K_M	14.33GB	否	质量良好，大多数用例的默认大小，推荐。
Mistral-Small-3.2-24B-Instruct-2506-Q4_K_S.gguf	Q4_K_S	13.55GB	否	质量稍低，但节省更多空间，推荐。
Mistral-Small-3.2-24B-Instruct-2506-Q4_0.gguf	Q4_0	13.49GB	否	旧格式，提供ARM和AVX CPU推理的在线重打包。
Mistral-Small-3.2-24B-Instruct-2506-IQ4_NL.gguf	IQ4_NL	13.47GB	否	与IQ4_XS相似，但稍大。提供ARM CPU推理的在线重打包。
Mistral-Small-3.2-24B-Instruct-2506-Q3_K_XL.gguf	Q3_K_XL	12.99GB	否	嵌入和输出权重使用Q8_0。质量较低但可用，适合低内存情况。
Mistral-Small-3.2-24B-Instruct-2506-IQ4_XS.gguf	IQ4_XS	12.76GB	否	质量不错，比Q4_K_S小，性能相似，推荐。
Mistral-Small-3.2-24B-Instruct-2506-Q3_K_L.gguf	Q3_K_L	12.40GB	否	质量较低但可用，适合低内存情况。
Mistral-Small-3.2-24B-Instruct-2506-Q3_K_M.gguf	Q3_K_M	11.47GB	否	低质量。
Mistral-Small-3.2-24B-Instruct-2506-IQ3_M.gguf	IQ3_M	10.65GB	否	中低质量，新方法，性能与Q3_K_M相当。
Mistral-Small-3.2-24B-Instruct-2506-Q3_K_S.gguf	Q3_K_S	10.40GB	否	低质量，不推荐。
Mistral-Small-3.2-24B-Instruct-2506-IQ3_XS.gguf	IQ3_XS	9.91GB	否	质量较低，新方法，性能不错，略优于Q3_K_S。
Mistral-Small-3.2-24B-Instruct-2506-Q2_K_L.gguf	Q2_K_L	9.55GB	否	嵌入和输出权重使用Q8_0。质量非常低，但出人意料地可用。
Mistral-Small-3.2-24B-Instruct-2506-IQ3_XXS.gguf	IQ3_XXS	9.28GB	否	质量较低，新方法，性能不错，与Q3量化相当。
Mistral-Small-3.2-24B-Instruct-2506-Q2_K.gguf	Q2_K	8.89GB	否	质量非常低，但出人意料地可用。
Mistral-Small-3.2-24B-Instruct-2506-IQ2_M.gguf	IQ2_M	8.11GB	否	质量相对较低，使用SOTA技术，出人意料地可用。
Mistral-Small-3.2-24B-Instruct-2506-IQ2_S.gguf	IQ2_S	7.48GB	否	低质量，使用SOTA技术，可用。
Mistral-Small-3.2-24B-Instruct-2506-IQ2_XS.gguf	IQ2_XS	7.21GB	否	低质量，使用SOTA技术，可用。
Mistral-Small-3.2-24B-Instruct-2506-IQ2_XXS.gguf	IQ2_XXS	6.55GB	否	质量非常低，使用SOTA技术，可用。