Llama-3.2-3B-Instruct開源多語言大模型 - 優化對話場景免費用！

首頁

Llama 3.2 3B Instruct

由alpindale開發

Llama 3.2 是 Meta 推出的多語言大語言模型集合，包含 1B 和 3B 大小的預訓練和指令調優生成模型。它針對多語言對話用例進行了優化，在常見行業基準測試中表現出色。

大型語言模型

Transformers

支持多種語言#多語言對話優化 #128k長上下文 #商業級RLHF調優

下載量 1,691

發布時間 : 9/25/2024

模型概述

Llama 3.2 是一種自迴歸語言模型，使用優化的變壓器架構，支持多種語言，適用於商業和研究用途。

模型特點

多語言支持

官方支持 8 種語言，並在更廣泛的語言集合上進行了訓練。

優化架構

採用優化的變壓器架構，調優版本使用監督微調（SFT）和基於人類反饋的強化學習（RLHF）。

高性能表現

在常見行業基準測試中，優於許多現有的開源和閉源聊天模型。

長上下文支持

支持 128k 的上下文長度。

模型能力

多語言文本生成

知識檢索

文本總結

移動 AI 寫作助手

查詢和提示重寫

使用案例

聊天和代理應用程序

多語言聊天助手

用於類似助手的聊天和代理應用程序。

支持多種語言的流暢對話。

知識檢索

從大量文本中檢索相關信息。

高效準確地提供所需信息。

文本生成

文本總結

生成長文本的簡潔總結。

保留關鍵信息的同時大幅縮短文本。

寫作助手

幫助用戶生成高質量的文本內容。

提高寫作效率和質量。

🚀 Llama 3.2 多語言大語言模型

Llama 3.2 是 Meta 推出的多語言大語言模型集合，包含 1B 和 3B 大小的預訓練和指令調優生成模型。它針對多語言對話用例進行了優化，在常見行業基準測試中表現出色，能為商業和研究領域提供強大的語言處理能力。

🚀 快速開始

使用 `transformers` 庫

從 transformers >= 4.43.0 版本開始，你可以使用 Transformers 的 pipeline 抽象或利用 Auto 類的 generate() 函數進行對話推理。

確保通過以下命令更新你的 transformers 庫：

pip install --upgrade transformers

以下是一個使用示例：

import torch
from transformers import pipeline

model_id = "meta-llama/Llama-3.2-3B-Instruct"
pipe = pipeline(
    "text-generation",
    model=model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)
messages = [
    {"role": "system", "content": "You are a pirate chatbot who always responds in pirate speak!"},
    {"role": "user", "content": "Who are you?"},
]
outputs = pipe(
    messages,
    max_new_tokens=256,
)
print(outputs[0]["generated_text"][-1])

注意：你還可以在 huggingface-llama-recipes 中找到如何在本地使用模型、使用 torch.compile()、輔助生成、量化等詳細方法。

使用 `llama` 代碼庫

請遵循倉庫中的說明。

要下載原始檢查點，請參考以下使用 huggingface-cli 的示例命令：

huggingface-cli download meta-llama/Llama-3.2-3B-Instruct --include "original/*" --local-dir Llama-3.2-3B-Instruct

✨ 主要特性

多語言支持：官方支持英語、德語、法語、意大利語、葡萄牙語、印地語、西班牙語和泰語，並且在更廣泛的語言集合上進行了訓練。
優化架構：採用優化的變壓器架構，調優版本使用監督微調（SFT）和基於人類反饋的強化學習（RLHF），以符合人類對有用性和安全性的偏好。
高性能表現：在常見行業基準測試中，優於許多現有的開源和閉源聊天模型。

📦 安裝指南

使用 `transformers` 庫

確保通過以下命令更新你的 transformers 庫：

pip install --upgrade transformers

💻 使用示例

基礎用法

import torch
from transformers import pipeline

model_id = "meta-llama/Llama-3.2-3B-Instruct"
pipe = pipeline(
    "text-generation",
    model=model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)
messages = [
    {"role": "system", "content": "You are a pirate chatbot who always responds in pirate speak!"},
    {"role": "user", "content": "Who are you?"},
]
outputs = pipe(
    messages,
    max_new_tokens=256,
)
print(outputs[0]["generated_text"][-1])

📚 詳細文檔

模型信息

屬性	詳情
模型開發者	Meta
模型架構	Llama 3.2 是一種自迴歸語言模型，使用優化的變壓器架構。調優版本使用監督微調（SFT）和基於人類反饋的強化學習（RLHF），以符合人類對有用性和安全性的偏好。
訓練數據	公開可用的在線數據的新組合。
參數	1B（1.23B）和 3B（3.21B）
輸入模態	多語言文本
輸出模態	多語言文本和代碼
上下文長度	128k
GQA	是
共享嵌入	是
令牌計數	最多 9T 令牌
知識截止日期	2023 年 12 月
支持語言	英語、德語、法語、意大利語、葡萄牙語、印地語、西班牙語和泰語。Llama 3.2 在比這 8 種支持語言更廣泛的語言集合上進行了訓練。開發者可以根據 Llama 3.2 社區許可證和可接受使用政策，對 Llama 3.2 模型進行微調以支持其他語言。
模型發佈日期	2024 年 9 月 25 日
狀態	這是一個在離線數據集上訓練的靜態模型。未來可能會發布改進模型能力和安全性的版本。
許可證	Llama 3.2 的使用受 Llama 3.2 社區許可證（自定義商業許可協議）的約束。
反饋	有關如何提供對模型的反饋或評論的說明，請參閱模型 README。有關生成參數和如何在應用程序中使用 Llama 3.2 的更多技術信息，請訪問此處。

預期用途

預期用例

Llama 3.2 旨在用於多種語言的商業和研究用途。指令調優的純文本模型適用於類似助手的聊天和代理應用程序，如知識檢索和總結、移動 AI 寫作助手以及查詢和提示重寫。預訓練模型可用於各種其他自然語言生成任務。

超出範圍

以任何違反適用法律法規（包括貿易合規法律）的方式使用。
以可接受使用政策和 Llama 3.2 社區許可證禁止的任何其他方式使用。
在本模型卡中未明確提及為支持的語言中使用。

硬件和軟件

訓練因素：使用自定義訓練庫、Meta 定製的 GPU 集群和生產環境。

📄 許可證

LLAMA 3.2 社區許可協議

Llama 3.2 版本發佈日期：2024 年 9 月 25 日

“協議”指本協議中規定的使用、複製、分發和修改 Llama 材料的條款和條件。

“文檔”指 Meta 在 https://llama.meta.com/doc/overview 上分發的隨 Llama 3.2 附帶的規格、手冊和文檔。

“被許可方”或“您”指您，或您的僱主或任何其他人或實體（如果您代表該人或實體簽訂本協議），且您已達到適用法律、規則或法規要求的提供法律同意的年齡，並且如果您代表您的僱主或其他人員或實體簽訂本協議，您具有約束他們的法律權力。

“Llama 3.2”指基礎大語言模型、軟件和算法，包括機器學習模型代碼、訓練好的模型權重、推理啟用代碼、訓練啟用代碼、微調啟用代碼以及 Meta 在 https://www.llama.com/llama-downloads 上分發的上述內容的其他元素。

“Llama 材料”指 Meta 根據本協議提供的專有 Llama 3.2 和文檔（及其任何部分）的統稱。

“Meta”或“我們”指 Meta Platforms Ireland Limited（如果您位於歐洲經濟區或瑞士，或者如果您是一個實體，您的主要營業地位於歐洲經濟區或瑞士）和 Meta Platforms, Inc.（如果您位於歐洲經濟區或瑞士以外）。

通過點擊下面的“我接受”，或使用或分發 Llama 材料的任何部分或元素，您同意受本協議的約束。

許可權利和再分發
- a. 權利授予：您被授予在 Meta 體現在 Llama 材料中的知識產權或其他權利下的非排他性、全球性、不可轉讓且免版稅的有限許可，以使用、複製、分發、拷貝、創作衍生作品以及對 Llama 材料進行修改。
- b. 再分發和使用
  - i. 如果您分發或提供 Llama 材料（或其任何衍生作品），或包含其中任何內容的產品或服務（包括另一個 AI 模型），您應（A）隨任何此類 Llama 材料提供本協議的副本；並且（B）在相關網站、用戶界面、博客文章、關於頁面或產品文檔上顯著顯示“Built with Llama”。如果您使用 Llama 材料或 Llama 材料的任何輸出或結果來創建、訓練、微調或以其他方式改進一個 AI 模型，並進行分發或提供，您還應在任何此類 AI 模型名稱的開頭包含“Llama”。
  - ii. 如果您作為集成終端用戶產品的一部分從被許可方處接收 Llama 材料或其任何衍生作品，則本協議第 2 條不適用於您。
  - iii. 您必須在您分發的所有 Llama 材料副本中，在作為此類副本一部分分發的“Notice”文本文件中保留以下歸屬聲明：“Llama 3.2 按照 Llama 3.2 社區許可證獲得許可，版權所有 © Meta Platforms, Inc. 保留所有權利。”
  - iv. 您對 Llama 材料的使用必須遵守適用的法律法規（包括貿易合規法律法規），並遵守 Llama 材料的可接受使用政策（可在 https://www.llama.com/llama3_2/use-policy 上獲取），該政策特此通過引用併入本協議。
額外商業條款：如果在 Llama 3.2 版本發佈日期，被許可方或被許可方的關聯方提供的產品或服務的月活躍用戶在前一個日曆月超過 7 億月活躍用戶，您必須向 Meta 請求許可，Meta 可自行決定是否授予您許可，並且在 Meta 明確授予您此類權利之前，您無權行使本協議下的任何權利。
保修免責聲明：除非適用法律要求，Llama 材料及其任何輸出和結果按“現狀”提供，不提供任何形式的保證，Meta 明確排除所有明示和暗示的保證，包括但不限於所有權、不侵權、適銷性或特定用途適用性的保證。您獨自負責確定使用或再分發 Llama 材料的適當性，並承擔使用 Llama 材料及其任何輸出和結果的相關風險。
責任限制：在任何情況下，Meta 或其關聯方均不對因本協議引起的任何利潤損失或任何間接、特殊、後果性、偶發性、懲戒性或懲罰性損害承擔責任，無論責任理論如何，包括合同、侵權、疏忽、產品責任或其他，即使 Meta 或其關聯方已被告知此類損害的可能性。
知識產權
- a. 本協議未授予商標許可，關於 Llama 材料，除非為描述和再分發 Llama 材料的合理和慣常使用所需，或如本節 5(a) 所述，Meta 和被許可方均不得使用對方或其任何關聯方擁有或關聯的任何名稱或標記。Meta 特此授予您僅為遵守第 1.b.i 條最後一句所需使用“Llama”（“標記”）的許可。您將遵守 Meta 的品牌指南（目前可在 https://about.meta.com/brand/resources/meta/company-brand/ 上獲取）。因您使用標記而產生的所有商譽歸 Meta 所有。
- b. 鑑於 Meta 對 Llama 材料及其衍生作品的所有權，關於您對 Llama 材料所做的任何衍生作品和修改，在您和 Meta 之間，您是並將是此類衍生作品和修改的所有者。
- c. 如果您對 Meta 或任何實體提起訴訟或其他程序（包括訴訟中的交叉索賠或反訴），聲稱 Llama 材料或 Llama 3.2 的輸出或結果，或上述任何部分構成侵犯您擁有或可許可的知識產權或其他權利，則本協議授予您的任何許可自此類訴訟或索賠提起之日起終止。您將賠償並使 Meta 免受因您使用或分發 Llama 材料而引起的或與之相關的任何第三方索賠。
期限和終止：本協議的期限自您接受本協議或訪問 Llama 材料之日起開始，並將持續有效，直至根據本協議的條款和條件終止。如果您違反本協議的任何條款和條件，Meta 可終止本協議。本協議終止後，您應刪除並停止使用 Llama 材料。第 3、4 和 7 條在本協議終止後仍然有效。
適用法律和管轄權：本協議受加利福尼亞州法律管轄並依其解釋，不考慮法律選擇原則，《聯合國國際貨物銷售合同公約》不適用於本協議。加利福尼亞州的法院對因本協議引起的任何爭議具有專屬管轄權。

Llama 3.2 可接受使用政策

Meta 致力於促進其工具和功能（包括 Llama 3.2）的安全和公平使用。如果您訪問或使用 Llama 3.2，您同意本可接受使用政策（“政策”）。本政策的最新版本可在 https://www.llama.com/llama3_2/use-policy 上找到。

禁止使用

我們希望每個人都能安全、負責任地使用 Llama 3.2。您同意您不會使用或允許他人使用 Llama 3.2 進行以下行為：

違反法律或他人權利，包括：
- 從事、促進、生成、促成、鼓勵、策劃、煽動或推動非法或違法活動或內容，例如：
  - 暴力或恐怖主義
  - 對兒童的剝削或傷害，包括招攬、創建、獲取或傳播兒童剝削內容或未報告兒童性虐待材料
  - 人口販運、剝削和性暴力
  - 向未成年人非法分發信息或材料，包括淫穢材料，或未對此類信息或材料採用法律要求的年齡限制
  - 性招攬
  - 任何其他犯罪活動
- 從事、促進、煽動或便利對個人或群體的騷擾、虐待、威脅或欺凌
- 從事、促進、煽動或便利在就業、就業福利、信貸、住房、其他經濟福利或其他基本商品和服務的提供方面的歧視或其他非法或有害行為
- 從事未經授權或無執照的任何專業實踐，包括但不限於金融、法律、醫療/健康或相關專業實踐
- 收集、處理、披露、生成或推斷個人的私人或敏感信息，包括個人身份、健康或人口統計信息，除非您已根據適用法律獲得這樣做的權利
- 從事或便利任何侵犯、挪用或以其他方式侵犯任何第三方權利的行為或生成任何內容，包括使用 Llama 材料的任何產品或服務的輸出或結果
- 創建、生成或便利創建惡意代碼、惡意軟件、計算機病毒或做任何其他可能禁用、負擔過重、干擾或損害網站或計算機系統的正常運行、完整性、操作或外觀的事情
- 從事任何故意規避或移除使用限制或其他安全措施的行為，或便利任何此類行為，或啟用 Meta 禁用的功能
從事、促進、煽動、便利或協助策劃或開展對個人造成死亡或身體傷害風險的活動，包括與以下方面相關的 Llama 3.2 的使用：
- 軍事、戰爭、核工業或應用、間諜活動、用於受美國國務院維護的《國際武器貿易條例》（ITAR）約束的材料或活動，或受 1989 年《美國生物武器反恐法》或 1997 年《化學武器公約實施法》約束的材料或活動
- 槍支和非法武器（包括武器開發）
- 非法藥物和受管制/受控物質
- 關鍵基礎設施、運輸技術或重型機械的操作
- 自我傷害或對他人的傷害，包括自殺、自殘和飲食失調
- 任何旨在煽動或促進暴力、虐待或對個人造成身體傷害的內容
故意欺騙或誤導他人，包括與以下方面相關的 Llama 3.2 的使用：
- 生成、促進或推動欺詐或虛假信息的創建或推廣
- 生成、促進或推動誹謗性內容，包括創建誹謗性聲明、圖像或其他內容
- 生成、促進或進一步分發垃圾郵件
- 在未經同意、授權或合法權利的情況下冒充他人
- 表示 Llama 3.2 的使用或輸出是人類生成的
- 生成或便利虛假的在線互動，包括虛假評論和其他虛假在線互動方式
未能向最終用戶適當披露您的 AI 系統的任何已知危險
與旨在生成非法內容或從事非法或有害行為的第三方工具、模型或軟件進行交互，並/或表示此類工具、模型或軟件的輸出與 Meta 或 Llama 3.2 相關聯

對於 Llama 3.2 中包含的任何多模態模型，如果您是居住在歐盟的個人或主要營業地在歐盟的公司，則本 Llama 3.2 社區許可協議第 1(a) 條授予的權利不適用於您。此限制不適用於包含任何此類多模態模型的產品或服務的最終用戶。

請通過以下方式之一報告任何違反本政策、軟件“漏洞”或其他可能導致違反本政策的問題：

報告模型問題：https://github.com/meta-llama/llama-models/issues
報告模型生成的風險內容：developers.facebook.com/llama_output_feedback
報告漏洞和安全問題：facebook.com/whitehat/info
報告違反可接受使用政策或未經授權使用 Llama 3.2 的情況：LlamaUseReport@meta.com

額外門控信息

您提供的信息將根據 Meta 隱私政策進行收集、存儲、處理和共享。

額外門控字段	類型
名字	文本
姓氏	文本
出生日期	日期選擇器
國家	國家選擇
所屬機構	文本
職位	選擇（學生、研究畢業生、AI 研究員、AI 開發者/工程師、記者、其他）
地理位置	IP 定位