M

Mistral Small 24B Instruct 2501 Quantized.w8a8

由RedHatAI開發
經過INT8量化的24B參數Mistral指令微調模型,顯著降低GPU內存需求並提高計算吞吐量
下載量 158
發布時間 : 3/3/2025

模型概述

基於Mistral-Small-24B-Instruct-2501的量化版本,支持多語言文本生成和對話任務,適用於低延遲推理場景

模型特點

高效量化
採用W8A8量化方案,減少50%內存佔用和磁盤空間,提升2倍計算吞吐量
多語言支持
支持24種語言的文本生成和理解
低延遲推理
優化後的模型特別適合需要快速響應的對話場景
企業級部署支持
提供Red Hat生態系統全棧部署方案

模型能力

多語言文本生成
指令跟隨
長文檔理解
編程輔助
數學推理

使用案例

對話系統
客服機器人
構建低延遲多語言客服對話系統
開發輔助
代碼生成
幫助開發者生成和優化代碼片段
教育
數學問題解答
解釋和解決數學問題
GSM8K評估得分90.00
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase