M

Mistral Small 24B Instruct 2501 GPTQ G128 W4A16 MSE

由ConfidentialMind開發
這是mistralai/Mistral-Small-24B-Instruct-2501模型的4位量化版本,由ConfidentialMind.com量化,實現了更小、更快的模型,同時性能損失極小。
下載量 93
發布時間 : 2/15/2025

模型概述

基於Mistral-Small-24B-Instruct-2501的4位量化模型,主要用於文本生成任務,適用於需要高效推理的場景。

模型特點

高效4位量化
使用GPTQ技術實現4位精度量化,顯著減少模型大小和推理時間。
組大小128
採用組大小128的量化策略,平衡了模型精度和推理效率。
MSE優化
使用MSE(均方誤差)和較高的阻尼因子進行量化優化,減少損失和困惑度。
單GPU支持
優化後可在單個NVIDIA A100 GPU(80GB顯存)上高效運行。

模型能力

文本生成
高效推理
量化模型部署

使用案例

高效文本生成
快速內容生成
在資源受限環境下快速生成高質量文本內容。
在保持較高生成質量的同時顯著提升推理速度。
研究應用
量化技術研究
作為大模型量化技術的研究案例。
展示4位量化在大語言模型上的應用效果。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase