L

Llama 3.1 Nemotron Nano 4B V1.1 GGUF

由lmstudio-community開發
由英偉達發佈的4B參數規模大語言模型,支持128k tokens上下文長度,專為推理、對話及RAG等任務優化
下載量 588
發布時間 : 5/20/2025

模型概述

基於Llama 3.1 8B模型通過剪枝和蒸餾創建的輕量級模型,優化了人類對話偏好及檢索增強生成(RAG)、工具調用等能力

模型特點

超長上下文支持
支持128k tokens的上下文窗口,適合處理長文檔和複雜對話場景
輕量化設計
通過剪枝和蒸餾技術從8B模型壓縮而來,保持性能的同時降低計算需求
對話優化
專門針對人類對話偏好進行優化,生成更自然的交互響應

模型能力

文本生成
對話系統
檢索增強生成(RAG)
工具調用

使用案例

智能助手
客服對話系統
部署為在線客服助手處理用戶諮詢
能理解複雜問題並生成符合業務場景的回覆
知識處理
長文檔分析
處理技術文檔、法律文書等長文本材料
利用128k上下文窗口保持長期記憶和連貫理解
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase