M

Meta Llama 3.1 8B FP8

由RedHatAI開發
Meta-Llama-3.1-8B的FP8量化版本,適用於多種語言的商業和研究用途。
下載量 4,154
發布時間 : 7/31/2024

模型概述

該模型是Meta-Llama-3.1-8B的量化版本,通過將權重和激活量化為FP8數據類型,顯著減少了磁盤大小和GPU內存需求。

模型特點

FP8量化
權重和激活量化為FP8數據類型,減少了約50%的磁盤大小和GPU內存需求。
多語言支持
支持包括英文、德文、法文等多種語言的文本生成任務。
高性能恢復率
在OpenLLM基準測試中,平均得分恢復率達到99.14%,接近原始模型的性能。

模型能力

文本生成
多語言支持
商業應用
研究用途

使用案例

商業應用
多語言客服機器人
利用模型的多語言支持能力,構建高效的客服機器人。
支持多種語言的即時交互,提升客戶滿意度。
研究用途
語言模型研究
用於研究量化對語言模型性能的影響。
提供高效的量化模型,便於研究和實驗。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase