L

Llama 3.1 Nemotron Nano 8B V1

由nvidia開發
基於Meta Llama-3.1-8B-Instruct優化的推理與對話模型,支持128K上下文長度,平衡效率與性能
下載量 60.52k
發布時間 : 3/16/2025

模型概述

專注於推理能力、人類對話偏好及任務執行(如RAG和工具調用)的大型語言模型,支持單卡RTX GPU本地部署

模型特點

雙模式推理
支持推理ON/OFF模式切換,ON模式提供逐步思考過程,OFF模式直接輸出結果
長上下文支持
支持長達128K tokens的上下文窗口,適合處理複雜文檔和長對話
高效部署
優化後可在RTX系列消費級GPU上單卡運行,降低部署門檻
強化學習優化
通過多輪強化學習(RLOO/RPO)優化人類偏好對齊和任務執行能力

模型能力

數學推理
代碼生成
工具調用
多輪對話
多語言支持
RAG系統集成

使用案例

智能助手
數學問題求解
解決複雜數學方程和證明題
MATH500測試集達到95.4%準確率
編程輔助
生成和調試Python代碼
MBPP零樣本測試84.6%通過率
企業應用
文檔分析
處理長文檔和合同文本分析
支持128K上下文長度
知識問答系統
構建基於RAG的專業領域問答系統
BFCL v2測試63.9%得分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase