M

Meta Llama 3 70B Instruct Quantized.w8a16

由RedHatAI開發
Meta-Llama-3-70B-Instruct 的量化版本,主要用於英文的商業和研究用途,能高效地進行類助手聊天。
下載量 1,035
發布時間 : 7/2/2024

模型概述

基於 Meta-Llama-3 架構的量化模型,通過 INT8 量化減少模型大小和 GPU 內存需求,適用於英文的商業和研究用途。

模型特點

INT8 量化
對 Transformer 塊內線性算子的權重進行 INT8 量化,使磁盤大小和 GPU 內存需求降低約 50%。
高效部署
支持通過 vLLM 和 Transformers 高效部署,適用於多 GPU 環境。
高恢復率
在 OpenLLM 基準測試中,量化模型的性能恢復率達到 98.4%。

模型能力

文本生成
類助手聊天
商業用途
研究用途

使用案例

商業應用
客戶服務助手
用於生成英文客戶服務回覆,提高響應效率。
研究應用
學術研究助手
輔助研究人員生成英文研究內容或摘要。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase