L

Llama 3.2 3B Instruct

由meta-llama開發
Llama 3.2是由Meta開發的多語言大語言模型系列,包含1B和3B規模的預訓練及指令調優生成模型,針對多語言對話場景優化。
下載量 1.6M
發布時間 : 9/18/2024

模型概述

Llama 3.2是一個經過指令調優的純文本生成模型,適用於多語言對話、代理檢索和摘要任務,在多項基準測試中表現優異。

模型特點

多語言支持
官方支持8種語言,訓練語言範圍更廣,開發者可針對其他語言進行微調。
長上下文處理
支持128k的上下文長度,適合處理長文檔和複雜對話場景。
高效量化
提供4位分組量化和SpinQuant技術,優化移動端部署和推理速度。
人類偏好對齊
通過監督微調(SFT)和人類反饋強化學習(RLHF)實現與人類偏好的一致性。

模型能力

多語言文本生成
代碼生成
長文檔處理
對話系統
摘要生成
信息檢索

使用案例

對話系統
多語言客服機器人
構建支持多種語言的智能客服系統,提供自然流暢的對話體驗。
在西班牙語和印地語等語言的MMLU測試中表現優異。
內容生成
多語言內容創作
自動生成多種語言的營銷文案、新聞摘要等內容。
在GSM8K數學問題和ARC-C推理測試中表現良好。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase