L

Llama 3.1 405B

由meta-llama開發
LLaMA 3.1是Meta推出的多語言大語言模型系列,包含8B、70B和405B三種規模,支持8種語言,在行業基準測試中表現優異。
下載量 19.20k
發布時間 : 7/16/2024

模型概述

基於優化Transformer架構的自迴歸語言模型,通過監督微調和人類反饋強化學習對齊人類偏好,適用於多語言對話和文本生成任務。

模型特點

多語言支持
原生支持8種語言處理,在多語言基準測試中表現優異
超長上下文
支持128k tokens的上下文長度,適合處理長文檔
安全防護
集成LLaMA Guard 3等安全工具,提供多層次風險管控
高效推理
採用GQA(Grouped Query Attention)技術提升推理效率

模型能力

多語言文本生成
指令跟隨對話
代碼生成
跨語言知識問答
長文檔理解

使用案例

商業應用
多語言客服助手
部署支持8種語言的智能客服系統
在MMLU測試中葡萄牙語準確率達84.95%
研究開發
模型微調基礎
作為領域專用模型的預訓練基礎
支持通過輸出改進其他模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase