M

Mistral Small 3.1 24B Instruct 2503 FP8 Dynamic

由 RedHatAI 开发
这是一个基于Mistral3架构的24B参数条件生成模型,经过FP8动态量化优化,适用于多语言文本生成和视觉理解任务。
下载量 2,650
发布时间 : 3/27/2025

模型简介

该模型是Mistral-Small-3.1-24B-Instruct-2503的FP8量化版本,通过降低权重和激活值的位数来减少GPU内存需求并提高计算效率,同时保持原始模型的大部分性能。

模型特点

FP8量化优化
通过FP8量化技术减少50%的GPU内存需求和磁盘空间,同时提高2倍矩阵乘法计算吞吐量
多语言支持
支持24种语言的文本生成和理解
多模态能力
能够处理图像和文本输入,进行跨模态理解
高效推理
优化后的模型适合低延迟应用场景,如对话代理和函数调用

模型能力

文本生成
图像理解
多语言处理
编程辅助
数学推理
长文档理解

使用案例

对话系统
智能客服
构建快速响应的多语言对话代理
在OpenLLM评估中保持原始模型97.9%的平均性能
编程辅助
代码生成
根据自然语言描述生成代码
在HumanEval评估中表现良好
教育
数学问题解答
解决数学推理问题
在GSM8K评估中达到49.96分
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase