L

Llama 3.3 70B Instruct Quantized.w8a8

由RedHatAI開發
這是Llama-3.3-70B-Instruct的量化版本模型,支持多語言文本生成,可用於商業和研究場景,在多個基準測試中表現出色。
下載量 19.02k
發布時間 : 1/20/2025

模型概述

Llama-3.3-70B-Instruct的量化版本,通過INT8量化優化了權重和激活,減少了GPU內存需求並提高了計算吞吐量,同時保持了原始模型的性能。

模型特點

多語言支持
支持英語、德語、法語、意大利語、葡萄牙語、印地語、西班牙語、泰語等多種語言的文本生成。
量化優化
對權重和激活進行INT8量化,減少GPU內存需求約50%,提高矩陣乘法計算吞吐量約2倍,同時磁盤大小需求減少約50%。
廣泛評估
在多個基準測試中進行了評估,如OpenLLM v1、OpenLLM v2、HumanEval和HumanEval+,與未量化模型相比表現出色。

模型能力

多語言文本生成
商業和研究用途
聊天助手場景

使用案例

商業和研究
多語言聊天助手
用於構建支持多種語言的聊天助手,適用於全球化的商業和研究場景。
在多語言MMLU測試中表現優異,恢復率接近100%。
代碼生成
用於生成和補全代碼,支持多種編程語言。
在HumanEval和HumanEval+測試中pass@1得分超過80%。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase