Q

QWQ 32B FP8

由qingcheng-ai開發
QwQ-32B-FP8 是 QwQ-32B 模型的 FP8 量化版本,保持了與 BF16 版本幾乎相同的準確率,同時支持更快的推理速度。
下載量 144
發布時間 : 3/21/2025

模型概述

FP8 量化版本的 QwQ-32B 模型,適用於高效推理任務,性能與原始 BF16 版本相當。

模型特點

高效推理
FP8 量化版本在保持與 BF16 版本相同準確率的同時,支持更快的推理速度。
高性能
在 MMLU 基準測試中表現優異,與原始 BF16 版本得分相同。
輕量化
通過 FP8 量化技術減少模型體積,適合資源有限的環境。

模型能力

文本生成
高效推理

使用案例

自然語言處理
問答系統
可用於構建高性能問答系統,處理複雜查詢。
在 MMLU 基準測試中得分 61.2,表現優異。
文本生成
適用於各種文本生成任務,如內容創作、摘要生成等。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase