Llama 3.2開源大語言模型 - 免費支持8種語言，優化多語言對話體驗

首頁

Llama 3.2 1B Instruct QLORA INT4 EO8

由meta-llama開發

Llama 3.2 是 Meta 推出的多語言大語言模型系列，包含 1B 和 3B 參數的預訓練和指令微調版本，支持 8 種官方語言，優化了多語言對話場景。

大型語言模型

PyTorch

支持多種語言#多語言對話優化 #指令微調生成 #GQA高效推理

下載量 286

發布時間 : 10/23/2024

模型概述

Llama 3.2 是針對多語言對話優化的生成模型，適用於知識檢索、摘要等任務，採用優化的變壓器架構和分組查詢注意力技術。

模型特點

多語言支持

官方支持 8 種語言，實際訓練語言更廣泛，可微調支持更多語言

高效推理

採用分組查詢注意力（GQA）技術提升推理可擴展性

安全優化

通過監督微調（SFT）和人類反饋強化學習（RLHF）確保輸出符合安全標準

模型能力

多語言文本生成

智能對話

知識檢索

文本摘要

查詢重寫

使用案例

智能助手

多語言聊天助手

支持多種語言的對話交互

在行業基準測試中優於多數開源/閉源聊天模型

移動端寫作助手

幫助用戶進行多語言內容創作

信息處理

知識檢索

從文本數據中提取關鍵信息

文檔摘要

生成多語言文本的簡潔摘要

🚀 Llama 3.2 多語言大語言模型

Llama 3.2 是一系列多語言大語言模型，涵蓋 1B 和 3B 規模的預訓練和指令微調生成模型。它針對多語言對話場景進行了優化，在常見行業基準測試中表現出色，能有效應用於知識檢索和摘要等任務。

🚀 快速開始

Llama 3.2 可用於商業和研究用途，支持多種語言。若你想使用該模型，需遵守 Llama 3.2 社區許可協議。

✨ 主要特性

多語言支持：官方支持英語、德語、法語、意大利語、葡萄牙語、印地語、西班牙語和泰語，且在更多語言上進行了訓練。
優化架構：採用優化的變壓器架構，微調版本使用監督微調（SFT）和基於人類反饋的強化學習（RLHF），以符合人類對有用性和安全性的偏好。
高效推理：所有模型版本均使用分組查詢注意力（GQA），提升推理可擴展性。

📦 安裝指南

文檔未提及具體安裝步驟，暫不提供。

💻 使用示例

文檔未提供代碼示例，暫不展示。

📚 詳細文檔

模型信息

Llama 3.2 多語言大語言模型集合包含 1B 和 3B 規模的預訓練和指令微調生成模型（文本輸入/文本輸出）。指令微調的純文本模型針對多語言對話用例進行了優化，包括智能檢索和摘要任務，在常見行業基準測試中優於許多可用的開源和閉源聊天模型。

屬性	詳情
模型開發者	Meta
模型架構	Llama 3.2 是一種自迴歸語言模型，使用優化的變壓器架構。微調版本使用監督微調（SFT）和基於人類反饋的強化學習（RLHF），以符合人類對有用性和安全性的偏好。
訓練數據	公開可用的在線數據的新組合。
支持語言	官方支持英語、德語、法語、意大利語、葡萄牙語、印地語、西班牙語和泰語。Llama 3.2 在比這 8 種支持語言更廣泛的語言集合上進行了訓練。開發者可根據 Llama 3.2 社區許可和可接受使用政策，對 Llama 3.2 模型進行微調以支持其他語言。
模型發佈日期	2024 年 10 月 24 日
狀態	這是一個在離線數據集上訓練的靜態模型。未來可能會發布改進模型能力和安全性的版本。
許可證	使用 Llama 3.2 受 Llama 3.2 社區許可協議（自定義商業許可協議）的約束。
反饋	有關如何提供對模型的反饋或評論的說明，請參閱 Llama 模型的 README。有關生成參數和如何在應用程序中使用 Llama 3.2 的技術信息，請訪問此處。

預期用途

預期用例

Llama 3.2 旨在用於多種語言的商業和研究用途。指令微調的純文本模型適用於類似助手的聊天和智能應用，如知識檢索和摘要、移動 AI 寫作助手以及查詢和提示重寫。預訓練模型可用於各種自然語言生成任務。同樣，量化模型可用於計算資源有限的各種設備端用例。

超出範圍

以任何違反適用法律法規（包括貿易合規法律）的方式使用。
以任何違反可接受使用政策和 Llama 3.2 社區許可協議的方式使用。
在本模型卡中未明確提及支持的語言中使用。

硬件和軟件

訓練因素

預訓練使用了自定義訓練庫、Meta 定製的 GPU 集群和生產基礎設施。微調、量化、標註和評估也在生產基礎設施上進行。

訓練能源使用

根據下表，訓練在 H100 - 80GB（TDP 為 700W）類型的硬件上累計使用了 916k GPU 小時的計算資源。訓練時間是訓練每個模型所需的總 GPU 時間，功耗是每個 GPU 設備使用的峰值功率容量，並根據功率使用效率進行了調整。

訓練溫室氣體排放

訓練估計的基於位置的總溫室氣體排放量為 240 噸 CO2eq。自 2020 年以來，Meta 在其全球運營中保持淨零溫室氣體排放，並以可再生能源匹配其 100% 的電力使用；因此，訓練的基於市場的總溫室氣體排放量為 0 噸 CO2eq。

	訓練時間（GPU 小時）	對數生成時間（GPU 小時）	訓練功耗（W）	訓練基於位置的溫室氣體排放（噸 CO2eq）	訓練基於市場的溫室氣體排放（噸 CO2eq）
Llama 3.2 1B	370k	-	700	-	-

Llama 3.2 社區許可協議

許可權利和再分發

權利授予：您被授予在 Llama 材料中體現的 Meta 知識產權或其他權利下的非排他性、全球範圍、不可轉讓和免版稅的有限許可，以使用、複製、分發、拷貝、創建衍生作品並對 Llama 材料進行修改。
再分發和使用：
- 若您分發或提供 Llama 材料（或其任何衍生作品），或包含其中任何內容的產品或服務（包括另一個 AI 模型），您應（A）隨任何此類 Llama 材料提供本協議的副本；（B）在相關網站、用戶界面、博客文章、關於頁面或產品文檔上顯著顯示“Built with Llama”。若您使用 Llama 材料或其任何輸出或結果來創建、訓練、微調或以其他方式改進一個 AI 模型，並進行分發或提供，則您還應在任何此類 AI 模型名稱的開頭包含“Llama”。
- 若您作為集成終端用戶產品的一部分從被許可方處接收 Llama 材料或其任何衍生作品，則本協議第 2 條不適用於您。
- 您必須在分發的所有 Llama 材料副本中，在作為此類副本一部分分發的“Notice”文本文件中保留以下歸屬聲明：“Llama 3.2 依據 Llama 3.2 社區許可協議獲得許可，版權所有 © Meta Platforms, Inc. 保留所有權利。”
- 您對 Llama 材料的使用必須符合適用法律法規（包括貿易合規法律法規），並遵守 Llama 材料的可接受使用政策（可在 https://www.llama.com/llama3_2/use-policy 獲得），該政策特此通過引用併入本協議。

額外商業條款

若在 Llama 3.2 版本發佈日期，被許可方或其關聯方提供的產品或服務的月活躍用戶在前一個日曆月超過 7 億月活躍用戶，您必須向 Meta 請求許可，Meta 可自行決定是否授予您許可，並且在 Meta 另行明確授予您此類權利之前，您無權行使本協議下的任何權利。

免責聲明

除非適用法律要求，Llama 材料及其任何輸出和結果按“原樣”提供，不提供任何形式的保證，Meta 明確排除所有形式的明示和暗示保證，包括但不限於所有權、不侵權、適銷性或特定用途適用性的保證。您獨自負責確定使用或再分發 Llama 材料的適當性，並承擔與使用 Llama 材料及其任何輸出和結果相關的任何風險。

責任限制

在任何情況下，Meta 或其關聯方均不對因本協議引起的任何利潤損失或任何間接、特殊、後果性、偶發性、懲戒性或懲罰性損害承擔責任，即使 Meta 或其關聯方已被告知此類損害的可能性。

知識產權

本協議未授予商標許可，與 Llama 材料相關，除非為描述和再分發 Llama 材料的合理和慣常使用所必需，或如本節 5(a) 所述，Meta 和被許可方均不得使用對方或其任何關聯方擁有或關聯的任何名稱或標記。Meta 特此授予您僅為遵守第 1.b.i 條最後一句所需的使用“Llama”（“標記”）的許可。您將遵守 Meta 的品牌指南（目前可在 https://about.meta.com/brand/resources/meta/company-brand/ 訪問）。因您使用標記而產生的所有商譽將歸屬於 Meta 的利益。
受 Meta 對 Llama 材料及其為 Meta 製作的衍生作品的所有權約束，就您製作的 Llama 材料的任何衍生作品和修改而言，在您和 Meta 之間，您是並將是此類衍生作品和修改的所有者。
若您對 Meta 或任何實體提起訴訟或其他程序（包括訴訟中的交叉索賠或反訴），聲稱 Llama 材料或 Llama 3.2 的輸出或結果，或其任何部分，構成侵犯您擁有或可許可的知識產權或其他權利，則本協議授予您的任何許可自此類訴訟或索賠提起之日起終止。您將賠償並使 Meta 免受任何第三方因您使用或分發 Llama 材料而產生或與之相關的任何索賠。

期限和終止

本協議的期限自您接受本協議或訪問 Llama 材料時開始，並將持續有效，直至根據本協議的條款和條件終止。若您違反本協議的任何條款或條件，Meta 可終止本協議。本協議終止後，您應刪除並停止使用 Llama 材料。第 3、4 和 7 條在本協議終止後仍然有效。

適用法律和管轄權

本協議受加利福尼亞州法律管轄並依其解釋，不考慮法律選擇原則，《聯合國國際貨物銷售合同公約》不適用於本協議。加利福尼亞州的法院對因本協議引起的任何爭議具有專屬管轄權。

Llama 3.2 可接受使用政策

Meta 致力於促進其工具和功能（包括 Llama 3.2）的安全和公平使用。若您訪問或使用 Llama 3.2，即表示您同意本可接受使用政策（“政策”）。本政策的最新版本可在 https://www.llama.com/llama3_2/use-policy 找到。

禁止使用

違反法律或他人權利：
- 參與、促進、生成、促成、鼓勵、策劃、煽動或推動非法或違法活動或內容，例如：
  - 暴力或恐怖主義
  - 對兒童的剝削或傷害，包括招攬、創建、獲取或傳播兒童剝削內容或未報告兒童性虐待材料
  - 人口販運、剝削和性暴力
  - 向未成年人非法分發信息或材料，包括淫穢材料，或未對此類信息或材料採用法律要求的年齡限制
  - 性招攬
  - 任何其他犯罪活動
- 參與、促進、煽動或便利對個人或群體的騷擾、虐待、威脅或欺凌
- 參與、促進、煽動或便利在就業、就業福利、信貸、住房、其他經濟福利或其他基本商品和服務的提供中進行歧視或其他非法或有害行為
- 從事未經授權或無執照的任何專業實踐，包括但不限於金融、法律、醫療/健康或相關專業實踐
- 收集、處理、披露、生成或推斷個人的私人或敏感信息，包括個人身份、健康或人口統計信息，除非您已根據適用法律獲得這樣做的權利
- 參與或便利任何侵犯、盜用或以其他方式侵犯任何第三方權利的行為或生成任何內容，包括使用 Llama 材料的任何產品或服務的輸出或結果
- 創建、生成或便利創建惡意代碼、惡意軟件、計算機病毒或做任何其他可能禁用、負擔過重、干擾或損害網站或計算機系統的正常運行、完整性、操作或外觀的事情
- 參與或便利任何故意規避或移除使用限制或其他安全措施的行動，或啟用 Meta 禁用的功能
從事有風險的活動：參與、促進、煽動、便利或協助策劃或開展對個人生命或身體造成傷害風險的活動，包括與以下方面相關的 Llama 3.2 的使用：
- 軍事、戰爭、核工業或應用、間諜活動、用於受美國國務院《國際武器貿易條例》（ITAR）約束的材料或活動，或用於 1989 年《美國生物武器反恐法》或 1997 年《化學武器公約實施法》約束的材料或活動
- 槍支和非法武器（包括武器開發）
- 非法藥物和受管制/受控物質
- 關鍵基礎設施、運輸技術或重型機械的操作
- 自我傷害或傷害他人，包括自殺、自殘和飲食失調
- 任何旨在煽動或促進暴力、虐待或對個人造成身體傷害的內容
故意欺騙或誤導他人：包括與以下方面相關的 Llama 3.2 的使用：
- 生成、促進或推動欺詐或創建或推廣虛假信息
- 生成、促進或推動誹謗性內容，包括創建誹謗性陳述、圖像或其他內容
- 生成、促進或進一步分發垃圾郵件
- 在未經同意、授權或合法權利的情況下冒充他人
- 表示 Llama 3.2 的使用或輸出是人類生成的
- 生成或便利虛假的在線互動，包括虛假評論和其他虛假在線互動方式
未適當披露風險：未能向最終用戶適當披露您的 AI 系統的任何已知危險
與非法工具交互：與旨在生成非法內容或從事非法或有害行為的第三方工具、模型或軟件進行交互，和/或表示此類工具、模型或軟件的輸出與 Meta 或 Llama 3.2 相關