M

Mistral Small 3.1 24B Instruct 2503 Quantized.w4a16

由RedHatAI開發
這是一個經過INT4量化的Mistral-Small-3.1-24B-Instruct-2503模型,由Red Hat (Neural Magic)優化發佈,適用於快速響應的對話代理和低延遲推理場景。
下載量 219
發布時間 : 4/15/2025

模型概述

該模型是基於Mistral-Small-3.1-24B-Instruct-2503進行INT4權重量化的版本,減少了約75%的磁盤大小和GPU內存需求,同時保持較好的性能。

模型特點

高效量化
採用INT4權重量化,減少75%的磁盤大小和GPU內存需求
多語言支持
支持24種語言的文本理解和生成
多模態能力
具備文本和圖像理解能力
低延遲推理
優化後適合快速響應的對話代理和函數調用

模型能力

文本生成
對話代理
編程推理
數學推理
長文檔理解
視覺理解
多語言處理

使用案例

對話系統
智能客服
用於構建快速響應的客戶服務對話系統
低延遲響應,支持多語言
代碼輔助
編程助手
幫助開發者理解和生成代碼
支持多種編程語言的代碼補全和解釋
文檔處理
長文檔摘要
自動生成長文檔的摘要和關鍵點
支持8192 tokens的長上下文理解
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase