L

Llama 3.1 Nemotron Nano 8B V1

Developed by nvidia
基於Meta Llama-3.1-8B-Instruct優化的推理與對話模型,支持128K上下文長度,平衡效率與性能
Downloads 60.52k
Release Time : 3/16/2025

Model Overview

專注於推理能力、人類對話偏好及任務執行(如RAG和工具調用)的大型語言模型,支持單卡RTX GPU本地部署

Model Features

雙模式推理
支持推理ON/OFF模式切換,ON模式提供逐步思考過程,OFF模式直接輸出結果
長上下文支持
支持長達128K tokens的上下文窗口,適合處理複雜文檔和長對話
高效部署
優化後可在RTX系列消費級GPU上單卡運行,降低部署門檻
強化學習優化
通過多輪強化學習(RLOO/RPO)優化人類偏好對齊和任務執行能力

Model Capabilities

數學推理
代碼生成
工具調用
多輪對話
多語言支持
RAG系統集成

Use Cases

智能助手
數學問題求解
解決複雜數學方程和證明題
MATH500測試集達到95.4%準確率
編程輔助
生成和調試Python代碼
MBPP零樣本測試84.6%通過率
企業應用
文檔分析
處理長文檔和合同文本分析
支持128K上下文長度
知識問答系統
構建基於RAG的專業領域問答系統
BFCL v2測試63.9%得分
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase