M

Meta Llama 3 70B

由meta-llama開發
Meta發佈的Llama 3系列大語言模型,包含8B和70B兩種規模的預訓練及指令調優生成式文本模型,針對對話場景優化,在行業基準測試中表現優異。
下載量 15.32k
發布時間 : 4/17/2024

模型概述

Llama 3是Meta研發的大語言模型系列,提供8B和70B參數的預訓練版與指令調優版,專注於文本和代碼生成任務,特別優化了對話場景的實用性與安全性。

模型特點

高效推理
採用分組查詢注意力機制(GQA)提升推理效率
安全優化
通過紅隊對抗測試和拒絕惡意請求優化,誤拒率較Llama2降低57%
大規模訓練
使用超過15萬億token的公開數據進行訓練,70B版本消耗640萬GPU小時
指令調優
通過監督微調(SFT)和人類反饋強化學習(RLHF)實現與人類偏好的對齊

模型能力

英語文本生成
代碼生成
常識推理
數學問題求解
對話系統

使用案例

商業應用
智能客服
部署指令調優版作為企業客服對話助手
在HumanEval測試中70B版本達到81.7分
學術研究
知識問答
用於學術領域的知識檢索和問答系統
MMLU綜合能力測試70B版本達79.5分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase