L

Llama 3.1 Nemotron Nano 4B V1.1 GGUF

由Mungert開發
Llama-3.1-Nemotron-Nano-4B-v1.1是一款基於Llama 3.1優化的大語言模型,在準確性和效率間取得良好平衡,適用於AI代理、聊天機器人等多種場景。
下載量 2,177
發布時間 : 5/21/2025

模型概述

該模型是NVIDIA開發的4B參數大語言模型,支持128K上下文長度,適用於推理、聊天、RAG和工具調用等任務。

模型特點

高效推理
支持128K長上下文,在單個RTX GPU上即可運行
動態量化技術
採用精度自適應量化方法,1-2比特量化下仍保持較高準確性
推理模式控制
可通過系統提示靈活開啟/關閉詳細推理過程
工具調用支持
內置工具調用解析器,支持vLLM服務器部署

模型能力

文本生成
數學推理
代碼生成
多輪對話
工具調用
多語言支持

使用案例

AI代理系統
智能聊天機器人
構建具備推理能力的對話系統
支持自然流暢的多輪對話
開發工具
代碼輔助
幫助開發者完成代碼補全和調試
支持多種編程語言
教育
數學解題助手
解答數學問題並展示推理過程
準確率較基礎模型提升明顯
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase