Llama 3.3-70B-Instruct-AWQ開源大語言模型 - 免費部署支持多語言對話交流

首頁

Llama 3.3 70b Instruct Awq

由casperhansen開發

Llama 3.3是Meta開發的多語言大語言模型，擁有700億參數，針對多語言對話用例優化，在多項基準測試中表現優異。

大型語言模型

Transformers

支持多種語言#700億參數大模型 #128k超長上下文 #8語種多語言對話

下載量 47.12k

發布時間 : 12/6/2024

模型概述

預訓練和指令調優的700億參數生成模型，支持多語言文本輸入/輸出，優化了對話場景下的表現。

模型特點

多語言支持

支持8種主要語言的文本生成和對話

長上下文處理

128k tokens的上下文長度，適合處理長文檔

高效推理

採用分組查詢注意力(GQA)技術提高推理效率

強化學習調優

通過RLHF(基於人類反饋的強化學習)優化對話安全性和幫助性

模型能力

多語言文本生成

指令跟隨

代碼生成

數學推理

工具使用

使用案例

對話系統

多語言客服機器人

支持多種語言的智能客服對話

在泰語和印地語等非英語語言中表現優異

代碼輔助

編程助手

幫助開發者生成和優化代碼

HumanEval基準測試pass@1達88.4%

教育輔助

數學問題解答

解決複雜數學問題並展示推理過程

MATH基準測試達77.0分

🚀 Llama 3.3 70B Instruct AWQ版本

這是Llama 3.3 70B指令模型的AWQ版本。在此處查看更多信息：https://github.com/casper-hansen/AutoAWQ。

🚀 快速開始

本項目提供了Llama 3.3 70B指令模型的AWQ版本，可用於多語言對話等場景。你可以通過參考相關鏈接獲取更多技術信息和使用方法。

📚 詳細文檔

模型信息

Meta Llama 3.3多語言大語言模型（LLM）是一個預訓練且經過指令微調的生成式模型，參數量為70B（文本輸入/文本輸出）。Llama 3.3經過指令微調的純文本模型針對多語言對話用例進行了優化，在常見行業基準測試中，其表現優於許多現有的開源和閉源聊天模型。

模型開發者：Meta

模型架構：Llama 3.3是一個自迴歸語言模型，採用了優化的Transformer架構。經過微調的版本使用監督微調（SFT）和基於人類反饋的強化學習（RLHF），以符合人類對於有用性和安全性的偏好。

屬性	詳情
模型開發者	Meta
模型架構	Llama 3.3是一個自迴歸語言模型，採用了優化的Transformer架構。經過微調的版本使用監督微調（SFT）和基於人類反饋的強化學習（RLHF），以符合人類對於有用性和安全性的偏好。
訓練數據	公開可用的在線數據的新組合。
參數數量	70B
輸入模態	多語言文本
輸出模態	多語言文本和代碼
上下文長度	128k
GQA	是
令牌數量	15T+
知識截止日期	2023年12月
支持的語言	英語、德語、法語、意大利語、葡萄牙語、印地語、西班牙語和泰語。
模型發佈日期	70B指令模型：2024年12月6日
狀態	這是一個基於離線數據集訓練的靜態模型。隨著我們通過社區反饋改進模型安全性，未來將發佈經過微調的模型版本。
許可證	自定義商業許可證，即Llama 3.3社區許可協議，可在以下鏈接獲取：https://github.com/meta-llama/llama-models/blob/main/models/llama3_3/LICENSE

關於模型的問題或評論發送地址：有關如何提供模型反饋或評論的說明，請參閱模型的README。有關生成參數和如何在應用程序中使用Llama 3.3的技術信息，請訪問此處。

基準測試

類別	基準測試	樣本數量	指標	Llama 3.1 8B指令模型	Llama 3.1 70B指令模型	Llama-3.3 70B指令模型	Llama 3.1 405B指令模型
	MMLU (CoT)	0	macro_avg/acc	73.0	86.0	86.0	88.6
	MMLU Pro (CoT)	5	macro_avg/acc	48.3	66.4	68.9	73.3
可控性	IFEval			80.4	87.5	92.1	88.6
推理能力	GPQA Diamond (CoT)	0	acc	31.8	48.0	50.5	49.0
代碼能力	HumanEval	0	pass@1	72.6	80.5	88.4	89.0
	MBPP EvalPlus (base)	0	pass@1	72.8	86.0	87.6	88.6
數學能力	MATH (CoT)	0	sympy_intersection_score	51.9	68.0	77.0	73.8
工具使用能力	BFCL v2	0	overall_ast_summary/macro_avg/valid	65.4	77.5	77.3	81.1
多語言能力	MGSM	0	em	68.9	86.9	91.1	91.6