L

Llama 3 3 Nemotron Super 49B V1

由nvidia開發
Llama-3.3-Nemotron-Super-49B-v1是基於Meta Llama-3.3-70B-Instruct的大型語言模型,專注於推理、對話偏好和任務執行,支持128K tokens上下文長度。
下載量 150.65k
發布時間 : 3/16/2025

模型概述

該模型通過神經架構搜索優化了內存佔用,適合在單個GPU上高效運行,適用於AI代理系統、聊天機器人和RAG系統等應用。

模型特點

高效推理優化
通過神經架構搜索減少內存佔用,提升吞吐量,適合在單個H100-80GB GPU上運行。
長上下文支持
支持128K tokens的上下文長度,適合處理複雜任務和大規模文檔。
多階段訓練
結合監督微調和強化學習(RLOO/RPO),優化數學、代碼、推理和對話能力。

模型能力

文本生成
數學推理
代碼生成
多輪對話
指令遵循
工具調用

使用案例

企業AI應用
智能客服
構建高精度對話系統,處理複雜用戶查詢。
在Arena-Hard基準測試中得分88.3(推理關閉模式)。
文檔分析
利用長上下文能力處理大型技術文檔或法律文本。
教育
數學解題輔助
逐步解答數學問題並給出推理過程。
在MATH500基準測試中pass@1達96.6(推理開啟模式)。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase