Mistral-Small-3.2-24B-Instruct-2506開源模型 - 多量化類型適配不同硬件需求

首頁

Mistralai Mistral Small 3.2 24B Instruct 2506 GGUF

由bartowski開發

這是Mistral-Small-3.2-24B-Instruct-2506模型的Llamacpp imatrix量化版本，提供多種量化類型以滿足不同硬件需求。

大型語言模型支持多種語言開源協議:Apache-2.0 #多語言指令模型 #高效量化部署 #低內存優化

下載量 3,769

發布時間 : 6/20/2025

模型概述

該項目提供了Mistral-Small-3.2-24B-Instruct-2506模型的不同量化版本，旨在優化模型在不同硬件上的運行效率和性能。

模型特點

多種量化類型

提供了豐富的量化類型，如bf16、Q8_0、Q6_K_L等，用戶可根據需求選擇不同的量化文件。

性能優化

部分量化文件通過將嵌入和輸出權重量化為Q8_0，提高了模型的性能和質量。

在線重打包

部分量化文件支持在線重打包，可自動優化硬件性能。

模型能力

文本生成

多語言支持

量化模型優化

使用案例

文本生成

多語言文本生成

支持多種語言的文本生成任務。

模型優化

硬件性能優化

通過量化優化模型在不同硬件上的運行效率。

🚀 Mistral-Small-3.2-24B-Instruct-2506的Llamacpp imatrix量化版本

本項目是對Mistral-Small-3.2-24B-Instruct-2506模型進行的Llamacpp imatrix量化處理，旨在提供不同量化類型的模型文件，以滿足不同硬件和性能需求。用戶可以根據自身設備的內存和性能選擇合適的量化文件，並在LM Studio或基於llama.cpp的項目中運行。

🔍 項目信息

屬性	詳情
量化者	bartowski
任務類型	圖像文本到文本
支持語言	英語、法語、德語、西班牙語、葡萄牙語、意大利語、日語、韓語、俄語、中文、阿拉伯語、波斯語、印尼語、馬來語、尼泊爾語、波蘭語、羅馬尼亞語、塞爾維亞語、瑞典語、土耳其語、烏克蘭語、越南語、印地語、孟加拉語
基礎模型	mistralai/Mistral-Small-3.2-24B-Instruct-2506
基礎模型關係	量化版本
許可證	Apache-2.0
推理功能	否

⚠️ 重要提示

如果你想了解我們如何處理你的個人數據，請閱讀我們的隱私政策。

🚀 快速開始

運行方式

LM Studio：可在 LM Studio 中運行量化後的模型。
llama.cpp：直接使用 llama.cpp 或任何基於llama.cpp的項目運行。

提示格式

<s>[SYSTEM_PROMPT]{system_prompt}[/SYSTEM_PROMPT][INST]{prompt}[/INST]

✨ 主要特性

多種量化類型：提供了豐富的量化類型，如bf16、Q8_0、Q6_K_L等，用戶可根據需求選擇不同的量化文件。
在線重打包：部分量化文件支持在線重打包，可自動優化硬件性能。
性能優化：部分量化文件通過將嵌入和輸出權重量化為Q8_0，提高了模型的性能和質量。

📦 安裝指南

安裝huggingface-cli

pip install -U "huggingface_hub[cli]"

下載單個文件

huggingface-cli download bartowski/mistralai_Mistral-Small-3.2-24B-Instruct-2506-GGUF --include "mistralai_Mistral-Small-3.2-24B-Instruct-2506-Q4_K_M.gguf" --local-dir ./

下載拆分文件

如果模型大於50GB，已拆分為多個文件，可使用以下命令下載到本地文件夾：

huggingface-cli download bartowski/mistralai_Mistral-Small-3.2-24B-Instruct-2506-GGUF --include "mistralai_Mistral-Small-3.2-24B-Instruct-2506-Q8_0/*" --local-dir ./

💻 使用示例

基礎用法

在LM Studio中，選擇下載的量化文件即可開始使用。

高級用法

使用llama.cpp直接運行模型，可根據需求調整參數，以獲得更好的性能和效果。

📚 詳細文檔

下載文件列表

文件名	量化類型	文件大小	拆分	描述
Mistral-Small-3.2-24B-Instruct-2506-bf16.gguf	bf16	47.15GB	否	完整的BF16權重。
Mistral-Small-3.2-24B-Instruct-2506-Q8_0.gguf	Q8_0	25.05GB	否	極高質量，通常不需要，但為最大可用量化。
Mistral-Small-3.2-24B-Instruct-2506-Q6_K_L.gguf	Q6_K_L	19.67GB	否	嵌入和輸出權重使用Q8_0。非常高質量，接近完美，推薦。
Mistral-Small-3.2-24B-Instruct-2506-Q6_K.gguf	Q6_K	19.35GB	否	非常高質量，接近完美，推薦。
Mistral-Small-3.2-24B-Instruct-2506-Q5_K_L.gguf	Q5_K_L	17.18GB	否	嵌入和輸出權重使用Q8_0。高質量，推薦。
Mistral-Small-3.2-24B-Instruct-2506-Q5_K_M.gguf	Q5_K_M	16.76GB	否	高質量，推薦。
Mistral-Small-3.2-24B-Instruct-2506-Q5_K_S.gguf	Q5_K_S	16.30GB	否	高質量，推薦。
Mistral-Small-3.2-24B-Instruct-2506-Q4_1.gguf	Q4_1	14.87GB	否	舊格式，性能與Q4_K_S相似，但在Apple硅芯片上提高了每瓦令牌數。
Mistral-Small-3.2-24B-Instruct-2506-Q4_K_L.gguf	Q4_K_L	14.83GB	否	嵌入和輸出權重使用Q8_0。質量良好，推薦。
Mistral-Small-3.2-24B-Instruct-2506-Q4_K_M.gguf	Q4_K_M	14.33GB	否	質量良好，大多數用例的默認大小，推薦。
Mistral-Small-3.2-24B-Instruct-2506-Q4_K_S.gguf	Q4_K_S	13.55GB	否	質量稍低，但節省更多空間，推薦。
Mistral-Small-3.2-24B-Instruct-2506-Q4_0.gguf	Q4_0	13.49GB	否	舊格式，提供ARM和AVX CPU推理的在線重打包。
Mistral-Small-3.2-24B-Instruct-2506-IQ4_NL.gguf	IQ4_NL	13.47GB	否	與IQ4_XS相似，但稍大。提供ARM CPU推理的在線重打包。
Mistral-Small-3.2-24B-Instruct-2506-Q3_K_XL.gguf	Q3_K_XL	12.99GB	否	嵌入和輸出權重使用Q8_0。質量較低但可用，適合低內存情況。
Mistral-Small-3.2-24B-Instruct-2506-IQ4_XS.gguf	IQ4_XS	12.76GB	否	質量不錯，比Q4_K_S小，性能相似，推薦。
Mistral-Small-3.2-24B-Instruct-2506-Q3_K_L.gguf	Q3_K_L	12.40GB	否	質量較低但可用，適合低內存情況。
Mistral-Small-3.2-24B-Instruct-2506-Q3_K_M.gguf	Q3_K_M	11.47GB	否	低質量。
Mistral-Small-3.2-24B-Instruct-2506-IQ3_M.gguf	IQ3_M	10.65GB	否	中低質量，新方法，性能與Q3_K_M相當。
Mistral-Small-3.2-24B-Instruct-2506-Q3_K_S.gguf	Q3_K_S	10.40GB	否	低質量，不推薦。
Mistral-Small-3.2-24B-Instruct-2506-IQ3_XS.gguf	IQ3_XS	9.91GB	否	質量較低，新方法，性能不錯，略優於Q3_K_S。
Mistral-Small-3.2-24B-Instruct-2506-Q2_K_L.gguf	Q2_K_L	9.55GB	否	嵌入和輸出權重使用Q8_0。質量非常低，但出人意料地可用。
Mistral-Small-3.2-24B-Instruct-2506-IQ3_XXS.gguf	IQ3_XXS	9.28GB	否	質量較低，新方法，性能不錯，與Q3量化相當。
Mistral-Small-3.2-24B-Instruct-2506-Q2_K.gguf	Q2_K	8.89GB	否	質量非常低，但出人意料地可用。
Mistral-Small-3.2-24B-Instruct-2506-IQ2_M.gguf	IQ2_M	8.11GB	否	質量相對較低，使用SOTA技術，出人意料地可用。
Mistral-Small-3.2-24B-Instruct-2506-IQ2_S.gguf	IQ2_S	7.48GB	否	低質量，使用SOTA技術，可用。
Mistral-Small-3.2-24B-Instruct-2506-IQ2_XS.gguf	IQ2_XS	7.21GB	否	低質量，使用SOTA技術，可用。
Mistral-Small-3.2-24B-Instruct-2506-IQ2_XXS.gguf	IQ2_XXS	6.55GB	否	質量非常低，使用SOTA技術，可用。