Q

Qwen3 30B A3B FP8 Dynamic

由RedHatAI開發
Qwen3-30B-A3B-FP8-dynamic是基於Qwen3-30B-A3B模型通過FP8量化優化的版本,顯著降低了內存需求和計算成本,同時保持了原始模型的高準確率。
下載量 187
發布時間 : 5/3/2025

模型概述

該模型通過將權重和激活量化為FP8格式,優化了內存使用和計算效率,適用於推理、函數調用、多語言指令遵循等任務。

模型特點

FP8量化
權重和激活均採用FP8量化,顯著降低內存需求和計算成本。
高效推理
通過量化優化,矩陣乘法計算吞吐量提升約2倍。
高準確率保持
量化後模型在多個基準測試中保持了原始模型99%以上的準確率。
多語言支持
支持多語言指令遵循和翻譯任務。

模型能力

文本生成
函數調用
多語言指令遵循
翻譯
領域微調

使用案例

自然語言處理
文本生成
生成高質量的自然語言文本
在OpenLLM基準測試中表現優異
多語言翻譯
支持多種語言之間的翻譯任務
專業領域應用
領域專家微調
可通過微調成為特定領域的專家模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase