L

Llama 3.1 405B Instruct

由meta-llama開發
Llama 3.1是由Meta開發的多語言大語言模型系列,包含8B、70B和405B三種規模,支持多語言文本生成和代碼生成任務。
下載量 34.83k
發布時間 : 4/25/2025

模型概述

Llama 3.1是一個多語言大語言模型系列,專為多語言對話場景優化,支持128k上下文長度,採用分組查詢注意力(GQA)機制。

模型特點

多語言支持
支持多種語言的文本生成和對話任務,包括英語、德語、法語等。
128k上下文長度
支持長達128k的上下文長度,適合處理長文本任務。
分組查詢注意力(GQA)機制
採用GQA機制,提升模型的計算效率和性能。
指令調優優化
通過監督微調(SFT)和人類反饋強化學習(RLHF)對齊人類偏好,優化對話場景表現。

模型能力

多語言文本生成
代碼生成
多語言對話
常識推理
閱讀理解
數學能力
工具調用

使用案例

商業與研究
多語言對話助手
用於商業場景的多語言對話助手,支持多種語言的用戶交互。
在行業常見基準測試中超越多數開源與閉源聊天模型。
文本生成任務
適用於各類文本生成任務,如文章創作、摘要生成等。
在MMLU、TriviaQA等基準測試中表現優異。
代碼生成
代碼補全與生成
支持代碼生成和補全任務,適用於開發者工具。
在HumanEval基準測試中pass@1得分高達89.0。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase