L

Llama 3 3 Nemotron Super 49B V1 GGUF

由unsloth開發
Llama-3.3-Nemotron-Super-49B-v1 是一個大型語言模型,基於 Meta Llama-3.3-70B-Instruct 改進,增強了推理能力、人類聊天偏好以及任務執行能力,支持 128K tokens 的上下文長度。
下載量 814
發布時間 : 5/22/2025

模型概述

該模型是一個推理和聊天模型,適用於英語和編程語言,支持多種非英語語言。經過多階段的後訓練過程,增強了數學、代碼、推理和工具調用能力。

模型特點

高效推理
通過神經架構搜索(NAS)優化,在精度和效率之間實現出色平衡,減少內存佔用,適配單塊 GPU。
多階段後訓練
經過監督微調和強化學習(RL)階段,增強數學、代碼、推理和指令跟隨能力。
長上下文支持
支持 128K tokens 的上下文長度,適合處理複雜任務和大規模數據。

模型能力

文本生成
數學推理
代碼生成
工具調用
多語言支持
指令跟隨

使用案例

AI 代理系統
聊天機器人
用於構建高效的聊天機器人,支持多輪對話和複雜指令。
在 MT-Bench 上得分為 9.17。
RAG 系統
用於構建檢索增強生成(RAG)系統,處理大規模上下文信息。
支持 128K tokens 的上下文長度。
數學與代碼
數學問題求解
解決複雜的數學問題,支持逐步推理和最終答案生成。
在 MATH500 上 pass@1 為 96.6(推理開啟)。
代碼生成
生成高質量的代碼,支持 Python 等多種編程語言。
在 MBPP 0-shot 上 pass@1 為 91.3(推理開啟)。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase