L

Llama 3.1 Nemotron Nano 4B V1.1 GGUF

由 Mungert 开发
Llama-3.1-Nemotron-Nano-4B-v1.1是一款基于Llama 3.1优化的大语言模型,在准确性和效率间取得良好平衡,适用于AI代理、聊天机器人等多种场景。
下载量 2,177
发布时间 : 5/21/2025

模型简介

该模型是NVIDIA开发的4B参数大语言模型,支持128K上下文长度,适用于推理、聊天、RAG和工具调用等任务。

模型特点

高效推理
支持128K长上下文,在单个RTX GPU上即可运行
动态量化技术
采用精度自适应量化方法,1-2比特量化下仍保持较高准确性
推理模式控制
可通过系统提示灵活开启/关闭详细推理过程
工具调用支持
内置工具调用解析器,支持vLLM服务器部署

模型能力

文本生成
数学推理
代码生成
多轮对话
工具调用
多语言支持

使用案例

AI代理系统
智能聊天机器人
构建具备推理能力的对话系统
支持自然流畅的多轮对话
开发工具
代码辅助
帮助开发者完成代码补全和调试
支持多种编程语言
教育
数学解题助手
解答数学问题并展示推理过程
准确率较基础模型提升明显
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase