L

Llama 3.1 Nemotron Nano 4B V1.1

由unsloth開發
Llama-3.1-Nemotron-Nano-4B-v1.1 是一個基於Llama 3.1 8B壓縮而來的大型語言模型,優化了推理能力和任務執行效率,適用於單塊RTX顯卡本地運行。
下載量 219
發布時間 : 5/21/2025

模型概述

該模型通過多階段後訓練流程增強其推理和非推理能力,包括數學、代碼、推理和工具調用的監督微調,以及對話和指令跟隨的強化學習。

模型特點

高效推理
通過LLM壓縮技術優化,適配單塊RTX顯卡,支持本地運行。
多階段訓練
結合監督微調(SFT)和強化學習(RL)提升模型在數學、代碼、推理和對話任務中的表現。
長上下文支持
支持最高131,072個標記的上下文長度,適合處理長文本任務。
工具調用支持
內置工具調用解析器,支持動態工具選擇和執行。

模型能力

文本生成
數學推理
代碼生成
工具調用
多語言支持
指令跟隨

使用案例

AI代理系統
聊天機器人
用於構建高效的對話系統,支持自然語言交互。
在MT-Bench基準測試中得分8.0(推理開啟模式)。
RAG系統
支持檢索增強生成任務,適用於知識密集型應用。
教育
數學問題求解
解決複雜的數學問題,如方程求解和證明。
在MATH500基準測試中pass@1達96.2%(推理開啟模式)。
開發工具
代碼生成
根據自然語言描述生成可執行的Python代碼。
在MBPP 0-shot基準測試中pass@1達85.8%(推理開啟模式)。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase