D

Devstral Small 2505.w4a16 Gptq

由 mratsim 开发
这是一个基于mistralai/Devstral-Small-2505模型的4位GPTQ量化版本,专为消费级硬件优化。
下载量 557
发布时间 : 5/25/2025

模型简介

该模型采用非对称GPTQ方法进行4位量化(仅权重4位,W4A16),使用2048个最大序列长度为4096的样本进行校准,适用于文本生成任务。

模型特点

4位GPTQ量化
采用非对称GPTQ方法将模型量化为4位(仅权重4位),显著降低硬件需求
优化的校准策略
使用2048个最大序列长度为4096的样本进行校准,降低过拟合风险并提高收敛性
消费级硬件适配
特别优化以在消费级GPU(如32GB VRAM)上运行

模型能力

文本生成
长序列处理(最大94000 tokens)

使用案例

代码相关任务
代码生成
基于OpenCodeInstruct数据集训练,适用于代码生成任务
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase