L

Llama 3.1 Nemotron Nano 8B V1 GGUF

由unsloth開發
Llama-3.1-Nemotron-Nano-8B-v1是基於Meta Llama-3.1-8B-Instruct的推理模型,經過後訓練增強推理能力、人類聊天偏好及任務執行能力。
下載量 22.18k
發布時間 : 5/11/2025

模型概述

這是一個大型語言模型(LLM),在模型準確性和效率之間提供良好平衡,支持128K上下文長度,適用於英語和編程語言。

模型特點

增強推理能力
經過多階段後訓練過程,包括監督微調和強化學習,顯著提升數學、代碼和推理能力
高效推理
可在單個RTX GPU上運行,適合本地部署,平衡計算效率與模型準確性
長上下文支持
支持128K標記的上下文長度,適合處理長文檔和複雜任務
雙模式推理
支持'推理開啟'和'推理關閉'兩種模式,適應不同場景需求

模型能力

文本生成
數學推理
代碼生成
指令跟隨
聊天對話
工具調用
RAG系統支持

使用案例

AI代理系統
智能聊天機器人
構建能夠理解複雜指令並進行自然對話的AI助手
在MT-Bench上獲得8.1分(推理開啟模式)
教育
數學問題解答
解決複雜數學問題並提供分步解釋
在MATH500上達到95.4% pass@1(推理開啟模式)
軟件開發
代碼生成與輔助
根據描述生成功能代碼或幫助調試
在MBPP 0-shot測試中達到84.6% pass@1
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase