Q

Qwen3 14B FP8 Dynamic

由 RedHatAI 开发
Qwen3-14B-FP8-dynamic 是一个经过优化的大语言模型,通过将激活值和权重量化为 FP8 数据类型,有效降低了 GPU 内存需求,提高了计算吞吐量。
下载量 167
发布时间 : 5/2/2025

模型简介

该模型适用于推理、函数调用、多语言指令跟随等多种场景,通过 FP8 量化技术优化了性能和资源使用效率。

模型特点

FP8 量化优化
采用 FP8 数据类型对激活值和权重进行量化,显著降低 GPU 内存需求和磁盘空间占用。
高效计算
通过量化技术提高约 2 倍的矩阵乘法计算吞吐量。
多场景适用
支持推理、函数调用、多语言指令跟随等多种应用场景。

模型能力

文本生成
指令跟随
函数调用
多语言翻译
推理任务

使用案例

自然语言处理
大语言模型简介生成
生成关于大语言模型的简短介绍文本。
生成符合要求的文本内容
多语言应用
多语言指令跟随
理解并执行多种语言的指令。
准确理解并响应多语言指令
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase