M

Meta Llama 3.1 405B Instruct FP8 Dynamic

由RedHatAI開發
Meta-Llama-3.1-405B-Instruct的FP8量化版本,適用於多語言的商業和研究用途,特別優化用於助手機器人場景。
下載量 97
發布時間 : 7/23/2024

模型概述

該模型是Meta-Llama-3.1-405B-Instruct的量化版本,通過將權重和激活量化為FP8數據類型,減少了約50%的磁盤大小和GPU內存需求。適用於類似助手的聊天場景。

模型特點

FP8量化
權重和激活量化為FP8數據類型,減少了約50%的磁盤大小和GPU內存需求。
多語言支持
支持多種語言,包括英語、德語、法語、意大利語、葡萄牙語、印地語、西班牙語和泰語。
高恢復率
在多個基準測試中實現了接近原始模型的性能,如Arena-Hard評估中實現了99.0%的恢復率。

模型能力

文本生成
多語言對話
數學推理
多項選擇任務

使用案例

聊天機器人
多語言助手
作為多語言助手機器人,支持多種語言的對話和任務完成。
在Arena-Hard評估中實現了66.7的得分。
研究工具
語言模型研究
用於研究量化對大型語言模型性能的影響。
在OpenLLM v1和v2評估中實現了接近原始模型的性能。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase