Q

Qwen3 14B FP8 Dynamic

由RedHatAI開發
Qwen3-14B-FP8-dynamic 是一個經過優化的大語言模型,通過將激活值和權重量化為 FP8 數據類型,有效降低了 GPU 內存需求,提高了計算吞吐量。
下載量 167
發布時間 : 5/2/2025

模型概述

該模型適用於推理、函數調用、多語言指令跟隨等多種場景,通過 FP8 量化技術優化了性能和資源使用效率。

模型特點

FP8 量化優化
採用 FP8 數據類型對激活值和權重進行量化,顯著降低 GPU 內存需求和磁盤空間佔用。
高效計算
通過量化技術提高約 2 倍的矩陣乘法計算吞吐量。
多場景適用
支持推理、函數調用、多語言指令跟隨等多種應用場景。

模型能力

文本生成
指令跟隨
函數調用
多語言翻譯
推理任務

使用案例

自然語言處理
大語言模型簡介生成
生成關於大語言模型的簡短介紹文本。
生成符合要求的文本內容
多語言應用
多語言指令跟隨
理解並執行多種語言的指令。
準確理解並響應多語言指令
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase