Llama-3.1-Nemotron-Nano-4B-v1.1-GGUF開源大語言模型

首頁

Llama 3.1 Nemotron Nano 4B V1.1 GGUF

由lmstudio-community開發

由英偉達發佈的4B參數規模大語言模型，支持128k tokens上下文長度，專為推理、對話及RAG等任務優化

大型語言模型英語開源協議:其他 #長上下文推理 #對話優化 #RAG增強

下載量 588

發布時間 : 5/20/2025

模型概述

基於Llama 3.1 8B模型通過剪枝和蒸餾創建的輕量級模型，優化了人類對話偏好及檢索增強生成(RAG)、工具調用等能力

模型特點

超長上下文支持

支持128k tokens的上下文窗口，適合處理長文檔和複雜對話場景

輕量化設計

通過剪枝和蒸餾技術從8B模型壓縮而來，保持性能的同時降低計算需求

對話優化

專門針對人類對話偏好進行優化，生成更自然的交互響應

模型能力

文本生成

對話系統

檢索增強生成(RAG)

工具調用

使用案例

智能助手

客服對話系統

部署為在線客服助手處理用戶諮詢

能理解複雜問題並生成符合業務場景的回覆

知識處理

長文檔分析

處理技術文檔、法律文書等長文本材料

利用128k上下文窗口保持長期記憶和連貫理解

🚀 英偉達Llama 3.1 Nemotron Nano 4B v1.1社區模型

該模型入選了 LM Studio 社區模型亮點計劃，此計劃旨在展示社區中新穎且值得關注的模型。快來 Discord 參與討論吧！

模型信息

屬性	詳情
量化者	bartowski
任務類型	文本生成
基礎模型	nvidia/Llama-3.1-Nemotron-Nano-4B-v1.1
許可證名稱	nvidia-open-model-license
語言	英語
訓練數據集	nvidia/Llama-Nemotron-Post-Training-Dataset
標籤	nvidia、llama-3
許可證	其他
許可證鏈接	https://www.nvidia.com/en-us/agreements/enterprise-software/nvidia-open-model-license/
基礎模型關係	量化版本

模型創建者：nvidia
原始模型：Llama-3.1-Nemotron-Nano-4B-v1.1
GGUF 量化：由 bartowski 基於 llama.cpp 版本 b5432 提供

🔧 技術細節

支持 128k 令牌的上下文長度。
由 Llama 3.1 8B 經過剪枝和蒸餾創建而成。
針對推理、人類對話偏好以及諸如 RAG 和工具調用等任務進行了調優。

🙏 特別感謝

特別感謝 Georgi Gerganov 以及整個 llama.cpp 團隊，是他們讓這一切成為可能。

⚠️ 免責聲明

LM Studio 並非社區模型計劃中任何模型的創建者、發起者或所有者。每個社區模型均由第三方創建和提供。LM Studio 不認可、支持、代表或保證任何社區模型的完整性、真實性、準確性或可靠性。您應明白，社區模型可能會生成具有冒犯性、有害性、不準確或其他不當或欺騙性的內容。每個社區模型的唯一責任方是發起該模型的個人或實體。LM Studio 可能不會監控或控制社區模型，並且不能也不會對任何此類模型承擔責任。LM Studio 不承擔關於社區模型的準確性、可靠性或益處的所有保證或擔保。此外，LM Studio 不保證社區模型將滿足您的要求，保證其安全性、不間斷性或在任何時間或地點可用，或保證無錯誤、無病毒，或保證任何錯誤將得到糾正等。您將對因使用或訪問社區模型、下載任何社區模型或使用 LM Studio 提供或通過 LM Studio 提供的任何其他社區模型而導致的任何損害承擔全部責任。