M

Mistral Small 3.1 24B Instruct 2503 FP8 Dynamic

由RedHatAI開發
這是一個基於Mistral3架構的24B參數條件生成模型,經過FP8動態量化優化,適用於多語言文本生成和視覺理解任務。
下載量 2,650
發布時間 : 3/27/2025

模型概述

該模型是Mistral-Small-3.1-24B-Instruct-2503的FP8量化版本,通過降低權重和激活值的位數來減少GPU內存需求並提高計算效率,同時保持原始模型的大部分性能。

模型特點

FP8量化優化
通過FP8量化技術減少50%的GPU內存需求和磁盤空間,同時提高2倍矩陣乘法計算吞吐量
多語言支持
支持24種語言的文本生成和理解
多模態能力
能夠處理圖像和文本輸入,進行跨模態理解
高效推理
優化後的模型適合低延遲應用場景,如對話代理和函數調用

模型能力

文本生成
圖像理解
多語言處理
編程輔助
數學推理
長文檔理解

使用案例

對話系統
智能客服
構建快速響應的多語言對話代理
在OpenLLM評估中保持原始模型97.9%的平均性能
編程輔助
代碼生成
根據自然語言描述生成代碼
在HumanEval評估中表現良好
教育
數學問題解答
解決數學推理問題
在GSM8K評估中達到49.96分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase