Llama-2-7b-chat-hf-Q4_K_M-GGUF開源聊天模型

首頁

Llama 2 7b Chat Hf Q4 K M GGUF

由matrixportal開發

Meta發佈的Llama 2系列7B參數聊天模型GGUF量化版本，適用於本地部署和推理

大型語言模型英語#量化輕量版 #本地化部署 #對話優化

下載量 220

發布時間 : 11/22/2024

模型概述

基於Llama 2架構優化的對話模型，支持文本生成任務，經過4-bit量化處理以降低硬件需求

模型特點

量化壓縮

採用GGUF格式的4-bit量化(Q4_K_M)，顯著減少模型體積和內存佔用

本地部署

支持通過llama.cpp在本地設備運行，無需雲端依賴

對話優化

專門針對對話場景微調的7B參數模型，平衡性能與資源消耗

模型能力

開放域對話

指令跟隨

上下文理解

多輪對話

使用案例

智能助手

個人知識問答

部署為本地知識庫接口，保護隱私的同時提供信息查詢

開發測試

模型原型開發

用於快速驗證對話系統原型，降低開發硬件門檻

🚀 matrixportal/Llama-2-7b-chat-hf-Q4_K_M-GGUF

本模型是通過llama.cpp，利用ggml.ai的GGUF-my-repo空間，從meta-llama/Llama-2-7b-chat-hf轉換為GGUF格式的。如需瞭解該模型的更多詳細信息，請參考原始模型卡片。

🚀 快速開始

使用llama.cpp

可通過brew（適用於Mac和Linux）安裝llama.cpp。

brew install llama.cpp

可以調用llama.cpp服務器或命令行界面（CLI）。

命令行界面（CLI）：

llama-cli --hf-repo matrixportal/Llama-2-7b-chat-hf-Q4_K_M-GGUF --hf-file llama-2-7b-chat-hf-q4_k_m.gguf -p "The meaning to life and the universe is"

服務器：

llama-server --hf-repo matrixportal/Llama-2-7b-chat-hf-Q4_K_M-GGUF --hf-file llama-2-7b-chat-hf-q4_k_m.gguf -c 2048

注意：你也可以直接按照Llama.cpp倉庫中列出的使用步驟來使用此檢查點。

步驟1：從GitHub克隆llama.cpp。

git clone https://github.com/ggerganov/llama.cpp

步驟2：進入llama.cpp文件夾，並使用LLAMA_CURL=1標誌以及其他特定於硬件的標誌（例如，在Linux上使用Nvidia GPU時使用LLAMA_CUDA=1）進行編譯。

cd llama.cpp && LLAMA_CURL=1 make

步驟3：通過主二進制文件運行推理。

./llama-cli --hf-repo matrixportal/Llama-2-7b-chat-hf-Q4_K_M-GGUF --hf-file llama-2-7b-chat-hf-q4_k_m.gguf -p "The meaning to life and the universe is"

或者

./llama-server --hf-repo matrixportal/Llama-2-7b-chat-hf-Q4_K_M-GGUF --hf-file llama-2-7b-chat-hf-q4_k_m.gguf -c 2048

額外的門禁信息

訪問模型要求

你需要與Meta共享聯繫信息才能訪問此模型。

LLAMA 2社區許可協議

“協議”指的是本文中規定的關於使用、複製、分發和修改Llama材料的條款和條件。 “文檔”指的是Meta在https://ai.meta.com/resources/models-and-libraries/llama-downloads/ 上分發的Llama 2隨附的規格、手冊和文檔。 “被許可方”或“你”指的是你，或者你的僱主，或者任何其他人或實體（如果你代表該人或實體簽訂本協議），該人需達到適用法律、規則或規定要求的提供法律同意的年齡，並且如果你代表僱主或其他人員或實體簽訂本協議，該人需具有約束他們的合法權力。 “Llama 2”指的是基礎大語言模型以及軟件和算法，包括機器學習模型代碼、訓練好的模型權重、推理啟用代碼、訓練啟用代碼、微調啟用代碼以及Meta在ai.meta.com/resources/models-and-libraries/llama-downloads/ 上分發的上述內容的其他元素。 “Llama材料”指的是Meta根據本協議提供的專有Llama 2和文檔（及其任何部分）。 “Meta”或“我們”指的是Meta Platforms Ireland Limited（如果你位於歐洲經濟區（EEA）或瑞士，或者如果你是一個實體，你的主要營業地在歐洲經濟區或瑞士）以及Meta Platforms, Inc.（如果你位於歐洲經濟區或瑞士以外）。

通過點擊下面的“我接受”，或者使用或分發Llama材料的任何部分或元素，你同意受本協議的約束。

許可權利和再分發
- 權利授予：你被授予在Meta體現在Llama材料中的知識產權或其他權利下的非排他性、全球性、不可轉讓且免版稅的有限許可，以使用、複製、分發、拷貝、創建衍生作品並對Llama材料進行修改。
- 再分發和使用
  - 如果你將Llama材料或其任何衍生作品分發給第三方，你應向該第三方提供本協議的副本。
  - 如果你作為集成終端用戶產品的一部分從被許可方處收到Llama材料或其任何衍生作品，則本協議第2條不適用於你。
  - 你在分發的所有Llama材料副本中，必須在作為此類副本一部分分發的“通知”文本文件中保留以下歸屬聲明：“Llama 2根據LLAMA 2社區許可協議獲得許可，版權所有 (c) Meta Platforms, Inc. 保留所有權利。”
  - 你對Llama材料的使用必須遵守適用的法律和法規（包括貿易合規法律和法規），並遵守Llama材料的可接受使用政策（可在https://ai.meta.com/llama/use-policy 上獲取），該政策特此通過引用併入本協議。
  - 你不得使用Llama材料或Llama材料的任何輸出或結果來改進任何其他大語言模型（不包括Llama 2或其衍生作品）。
額外的商業條款：如果在Llama 2版本發佈日期，被許可方或被許可方的關聯方提供的產品或服務的月活躍用戶在前一個日曆月超過7億，則你必須向Meta請求許可，Meta可自行決定是否授予你許可，並且在Meta明確授予你此類權利之前，你無權行使本協議下的任何權利。
保修免責聲明：除非適用法律要求，否則Llama材料及其任何輸出和結果按“現狀”提供，不提供任何形式的明示或暗示保證，包括但不限於所有權、不侵權、適銷性或特定用途適用性的保證。你獨自負責確定使用或再分發Llama材料的適當性，並承擔使用Llama材料及其任何輸出和結果的相關風險。
責任限制：在任何情況下，Meta或其關聯方均不對因本協議引起的任何利潤損失或任何間接、特殊、後果性、偶發性、懲戒性或懲罰性損害承擔責任，無論責任理論是合同、侵權、疏忽、產品責任還是其他，即使Meta或其關聯方已被告知此類損害的可能性。
知識產權
- 本協議未授予商標許可，並且在涉及Llama材料時，Meta和被許可方均不得使用對方或其任何關聯方擁有或關聯的任何名稱或標記，除非在描述和再分發Llama材料時進行合理和慣常使用所需。
- 鑑於Meta對Llama材料及其衍生作品的所有權，對於你對Llama材料進行的任何衍生作品和修改，在你和Meta之間，你是並將是此類衍生作品和修改的所有者。
- 如果你對Meta或任何實體提起訴訟或其他程序（包括在訴訟中的交叉索賠或反訴），聲稱Llama材料或Llama 2的輸出或結果，或上述任何部分構成侵犯你擁有或可許可的知識產權或其他權利，則本協議授予你的任何許可應自提起此類訴訟或索賠之日起終止。你將賠償並使Meta免受任何第三方因你使用或分發Llama材料而產生或與之相關的索賠。
期限和終止：本協議的期限將從你接受本協議或訪問Llama材料時開始，並將持續有效，直至根據本協議的條款和條件終止。如果你違反本協議的任何條款或條件，Meta可終止本協議。本協議終止後，你應刪除並停止使用Llama材料。第3條、第4條和第7條在本協議終止後仍然有效。
適用法律和管轄權：本協議將受加利福尼亞州法律管轄並依其解釋，不考慮法律選擇原則，並且《聯合國國際貨物銷售合同公約》不適用於本協議。加利福尼亞州的法院對因本協議引起的任何爭議具有專屬管轄權。

Llama 2可接受使用政策

Meta致力於促進其工具和功能（包括Llama 2）的安全和公平使用。如果你訪問或使用Llama 2，你同意遵守本可接受使用政策（“政策”）。本政策的最新版本可在ai.meta.com/llama/use-policy找到。

禁止使用情況

我們希望每個人都能安全、負責地使用Llama 2。你同意你不會使用或允許他人使用Llama 2來：

違反法律或他人權利，包括：
- 從事、促進、生成、促成、鼓勵、策劃、煽動或助長非法或違法活動或內容，例如：
  - 暴力或恐怖主義
  - 對兒童的剝削或傷害，包括招攬、創建、獲取或傳播兒童剝削性內容，或未報告兒童性虐待材料
  - 人口販運、剝削和性暴力
  - 向未成年人非法分發信息或材料，包括淫穢材料，或未對此類信息或材料採用法律要求的年齡限制
  - 性招攬
  - 任何其他犯罪活動
- 從事、促進、煽動或助長對個人或群體的騷擾、虐待、威脅或欺凌
- 從事、促進、煽動或助長在就業、就業福利、信貸、住房、其他經濟福利或其他基本商品和服務的提供方面的歧視或其他非法或有害行為
- 從事未經授權或無執照的任何專業實踐，包括但不限於金融、法律、醫療/健康或相關專業實踐
- 在未獲得適用法律要求的權利和同意的情況下，收集、處理、披露、生成或推斷個人的健康、人口統計或其他敏感個人或私人信息
- 從事或促成任何侵犯、盜用或以其他方式侵犯任何第三方權利的行為或生成任何內容，包括使用Llama 2材料的任何產品或服務的輸出或結果
- 創建、生成或促成惡意代碼、惡意軟件、計算機病毒的創建，或做任何可能禁用、使負擔過重、干擾或損害網站或計算機系統的正常運行、完整性、操作或外觀的事情
從事、促進、煽動、促成或協助策劃或開展對個人造成死亡或身體傷害風險的活動，包括與以下方面相關的Llama 2使用：
- 軍事、戰爭、核工業或應用、間諜活動、用於受美國國務院維護的《國際武器貿易條例》（ITAR）管制的材料或活動
- 槍支和非法武器（包括武器開發）
- 非法毒品和受管制/受控物質
- 關鍵基礎設施、運輸技術或重型機械的操作
- 自我傷害或對他人的傷害，包括自殺、自殘和飲食失調
- 任何旨在煽動或促進暴力、虐待或對個人造成身體傷害的內容
故意欺騙或誤導他人，包括與以下方面相關的Llama 2使用：
- 生成、促進或助長欺詐或虛假信息的創建或傳播
- 生成、促進或助長誹謗性內容，包括創建誹謗性聲明、圖像或其他內容
- 生成、促進或進一步分發垃圾郵件
- 在未經同意、授權或合法權利的情況下冒充他人
- 聲稱Llama 2的使用或輸出是人類生成的
- 生成或促成虛假的在線互動，包括虛假評論和其他虛假在線互動方式
未能向終端用戶適當披露你的AI系統的任何已知危險

請通過以下方式之一報告任何違反本政策、軟件“漏洞”或其他可能導致違反本政策的問題： - 報告模型問題：github.com/facebookresearch/llama - 報告模型生成的風險內容：developers.facebook.com/llama_output_feedback - 報告漏洞和安全問題：facebook.com/whitehat/info - 報告違反可接受使用政策或未經授權使用Llama的情況：LlamaUseReport@meta.com

門禁字段信息

屬性	詳情
名字	文本輸入
姓氏	文本輸入
出生日期	日期選擇器
國家	國家選擇
所屬機構	文本輸入
地理位置	IP定位
確認信息	通過勾選確認接受許可條款，並承認提供的信息將根據Meta隱私政策進行收集、存儲、處理和共享