L

Llama 3.3 70b Instruct Awq

由casperhansen開發
Llama 3.3是Meta開發的多語言大語言模型,擁有700億參數,針對多語言對話用例優化,在多項基準測試中表現優異。
下載量 47.12k
發布時間 : 12/6/2024

模型概述

預訓練和指令調優的700億參數生成模型,支持多語言文本輸入/輸出,優化了對話場景下的表現。

模型特點

多語言支持
支持8種主要語言的文本生成和對話
長上下文處理
128k tokens的上下文長度,適合處理長文檔
高效推理
採用分組查詢注意力(GQA)技術提高推理效率
強化學習調優
通過RLHF(基於人類反饋的強化學習)優化對話安全性和幫助性

模型能力

多語言文本生成
指令跟隨
代碼生成
數學推理
工具使用

使用案例

對話系統
多語言客服機器人
支持多種語言的智能客服對話
在泰語和印地語等非英語語言中表現優異
代碼輔助
編程助手
幫助開發者生成和優化代碼
HumanEval基準測試pass@1達88.4%
教育輔助
數學問題解答
解決複雜數學問題並展示推理過程
MATH基準測試達77.0分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase