M

Mistral Small 3.1 24B Instruct 2503 Quantized.w4a16

由 RedHatAI 开发
这是一个经过INT4量化的Mistral-Small-3.1-24B-Instruct-2503模型,由Red Hat (Neural Magic)优化发布,适用于快速响应的对话代理和低延迟推理场景。
下载量 219
发布时间 : 4/15/2025

模型简介

该模型是基于Mistral-Small-3.1-24B-Instruct-2503进行INT4权重量化的版本,减少了约75%的磁盘大小和GPU内存需求,同时保持较好的性能。

模型特点

高效量化
采用INT4权重量化,减少75%的磁盘大小和GPU内存需求
多语言支持
支持24种语言的文本理解和生成
多模态能力
具备文本和图像理解能力
低延迟推理
优化后适合快速响应的对话代理和函数调用

模型能力

文本生成
对话代理
编程推理
数学推理
长文档理解
视觉理解
多语言处理

使用案例

对话系统
智能客服
用于构建快速响应的客户服务对话系统
低延迟响应,支持多语言
代码辅助
编程助手
帮助开发者理解和生成代码
支持多种编程语言的代码补全和解释
文档处理
长文档摘要
自动生成长文档的摘要和关键点
支持8192 tokens的长上下文理解
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase