L

Llama 3 1 Nemotron Ultra 253B V1

由nvidia開發
基於Meta Llama-3.1-405B-Instruct衍生的大型語言模型,通過神經架構搜索技術優化,支持128K tokens上下文長度,適用於推理、對話和指令跟隨任務。
下載量 21.78k
發布時間 : 4/7/2025

模型概述

Llama-3.1-Nemotron-Ultra-253B-v1是NVIDIA開發的大型語言模型,專為高效推理和複雜任務設計,支持多語言和長上下文處理。

模型特點

高效推理優化
通過神經架構搜索(NAS)技術優化模型結構,顯著降低內存佔用,提升推理效率。
長上下文支持
支持最長131,072 tokens的上下文處理能力,適合處理複雜任務。
多階段訓練
經過監督微調和強化學習多階段訓練,優化數學、編程、推理和對話能力。
推理模式控制
支持通過系統提示詞開啟/關閉詳細推理模式,適應不同應用場景需求。

模型能力

文本生成
數學推理
編程輔助
多語言處理
指令跟隨
工具調用
RAG系統支持

使用案例

AI智能體系統
聊天機器人
構建高性能對話系統,支持複雜交互和多輪對話。
在對話任務中表現優異
RAG系統
支持基於檢索的生成任務,處理長文檔和複雜查詢。
支持128K tokens上下文
專業領域應用
醫學問答
回答專業醫學問題,支持診斷輔助。
GPQA測試通過率76.01%
數學競賽
解決複雜數學問題,支持逐步推理。
AIME25測試通過率72.50%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase