L

Llama 3.1 405B FP8

由meta-llama開發
Meta羊駝3.1是多語言大語言模型集合,包含80億、700億和4050億參數的預訓練及指令調優生成模型,支持8種語言,在行業基準測試中表現優異。
下載量 540
發布時間 : 7/20/2024

模型概述

基於優化Transformer架構的自迴歸語言模型,採用監督微調和人類反饋強化學習對齊人類偏好,適用於多語言對話場景和文本生成任務。

模型特點

多語言支持
支持8種語言的文本生成與對話,包括印地語和泰語等非拉丁語系語言
長上下文處理
128k tokens的超長上下文窗口,適合處理複雜文檔和長對話
高效推理
採用GQA(分組查詢注意力)機制提升推理效率
安全對齊
通過RLHF強化學習對齊人類價值觀,內置三重安全防護體系

模型能力

多語言文本生成
指令跟隨
代碼生成
數學推理
工具使用API調用
知識問答
長文檔摘要

使用案例

商業應用
多語言客服助手
部署支持8種語言的智能客服系統
在MMLU多語言測試中405B模型達84-85%準確率
文檔處理
長文檔分析與摘要生成
支持128k tokens上下文處理
研究開發
模型蒸餾
利用合成數據改進其他模型
提供2500萬條微調數據示例
安全研究
評估大模型潛在風險
包含生化武器風險專項評估框架
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase