Llama-3.2-3B-Instruct-GGUF開源多語言大模型 - 免費部署助力高效對話交流

首頁

Llama 3.2 3B Instruct GGUF

由unsloth開發

Llama-3.2-3B是Meta推出的多語言大語言模型，包含3B參數的預訓練和指令調優生成模型，針對多語言對話用例進行了優化。

大型語言模型英語#多語言對話優化 #代理檢索增強 #低內存微調

下載量 40.11k

發布時間 : 9/25/2024

模型概述

Llama-3.2-3B是一個多語言大語言模型，針對多語言對話用例進行了優化，包括代理檢索和摘要任務。它在常見的行業基準測試中優於許多開源和閉源聊天模型。

模型特點

多語言支持

支持英語、德語、法語、意大利語、葡萄牙語、印地語、西班牙語和泰語等多種語言。

優化的transformer架構

採用優化的transformer架構，使用分組查詢注意力(GQA)以提高推理可擴展性。

指令調優

使用監督微調(SFT)和基於人類反饋的強化學習(RLHF)來與人類偏好對齊，確保幫助性和安全性。

高性能

在常見的行業基準測試中優於許多開源和閉源聊天模型。

模型能力

文本生成

多語言對話

代理檢索

摘要任務

使用案例

對話系統

多語言聊天機器人

用於構建支持多種語言的聊天機器人。

在常見的行業基準測試中優於許多開源和閉源聊天模型。

信息檢索

代理檢索

用於信息檢索和代理任務。

文本處理

文本摘要

用於生成文本摘要。

🚀 Llama-3.2-3B

本項目提供了對Llama-3.2-3B模型的相關支持，包括不同比特位的GGUF上傳、免費的微調筆記本等，能讓你更高效地使用和微調該模型。

🚀 快速開始

查看全量版本

查看我們的模型集合，獲取包括GGUF、4比特和原始16比特格式在內的所有Llama 3.2版本。

GGUF上傳

提供16比特、8比特、6比特、5比特、4比特、3比特和2比特的上傳版本。

免費微調

我們有一個免費的Google Colab Tesla T4筆記本用於Llama 3.2 (3B)，點擊鏈接即可使用：免費筆記本

加入我們的社區：

模型詳情

如需瞭解該模型的更多詳細信息，請訪問Meta的原始模型卡片

✨ 主要特性

免費微調

所有筆記本都 對初學者友好！添加你的數據集，點擊“全部運行”，你將獲得一個速度快2倍的微調模型，該模型可以導出為GGUF、vLLM格式或上傳到Hugging Face。

Unsloth支持的模型	免費筆記本鏈接	性能提升	內存使用減少
Llama-3.2 (3B)	▶️ 在Colab上開始	2.4倍更快	58%更少
Llama-3.1 (11B vision)	▶️ 在Colab上開始	2.4倍更快	58%更少
Llama-3.1 (8B)	▶️ 在Colab上開始	2.4倍更快	58%更少
Phi-3.5 (mini)	▶️ 在Colab上開始	2倍更快	50%更少
Gemma 2 (9B)	▶️ 在Colab上開始	2.4倍更快	58%更少
Mistral (7B)	▶️ 在Colab上開始	2.2倍更快	62%更少
DPO - Zephyr	▶️ 在Colab上開始	1.9倍更快	19%更少

對話筆記本適用於ShareGPT ChatML / Vicuna模板。
文本完成筆記本適用於原始文本。DPO筆記本可複製Zephyr。
* Kaggle有2個T4，但我們使用1個。由於開銷問題，1個T4快5倍。

特別感謝

非常感謝Meta和Llama團隊創建併發布這些模型。

📚 詳細文檔

模型信息

Meta Llama 3.2多語言大語言模型（LLM）集合是一組預訓練和指令微調的生成模型，大小為1B和3B（文本輸入/文本輸出）。Llama 3.2指令微調的純文本模型針對多語言對話用例進行了優化，包括智能檢索和摘要任務。在常見的行業基準測試中，它們的表現優於許多現有的開源和閉源聊天模型。

屬性	詳情
模型開發者	Meta
模型架構	Llama 3.2是一個自迴歸語言模型，使用了優化的Transformer架構。微調版本使用監督微調（SFT）和基於人類反饋的強化學習（RLHF）來符合人類對有用性和安全性的偏好。
支持的語言	官方支持英語、德語、法語、意大利語、葡萄牙語、印地語、西班牙語和泰語。Llama 3.2的訓練語言比這8種支持的語言更廣泛。開發者可以根據Llama 3.2社區許可證和可接受使用政策，對Llama 3.2模型進行微調以支持這些支持語言之外的語言。開發者應始終確保他們的部署（包括涉及其他語言的部署）是安全和負責任的。
Llama 3.2模型家族	標記計數僅指預訓練數據。所有模型版本都使用分組查詢注意力（GQA）來提高推理可擴展性。
模型發佈日期	2024年9月25日
狀態	這是一個在離線數據集上訓練的靜態模型。未來可能會發布改進模型能力和安全性的版本。
許可證	Llama 3.2的使用受 Llama 3.2社區許可證（自定義商業許可協議）的約束。