Llama 3.3 70b Instruct Awq
Llama 3.3是Meta開發的多語言大語言模型,擁有700億參數,針對多語言對話用例優化,在多項基準測試中表現優異。
下載量 47.12k
發布時間 : 12/6/2024
模型概述
預訓練和指令調優的700億參數生成模型,支持多語言文本輸入/輸出,優化了對話場景下的表現。
模型特點
多語言支持
支持8種主要語言的文本生成和對話
長上下文處理
128k tokens的上下文長度,適合處理長文檔
高效推理
採用分組查詢注意力(GQA)技術提高推理效率
強化學習調優
通過RLHF(基於人類反饋的強化學習)優化對話安全性和幫助性
模型能力
多語言文本生成
指令跟隨
代碼生成
數學推理
工具使用
使用案例
對話系統
多語言客服機器人
支持多種語言的智能客服對話
在泰語和印地語等非英語語言中表現優異
代碼輔助
編程助手
幫助開發者生成和優化代碼
HumanEval基準測試pass@1達88.4%
教育輔助
數學問題解答
解決複雜數學問題並展示推理過程
MATH基準測試達77.0分
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98