L

Llama 3 3 Nemotron Super 49B V1 FP8

由nvidia開發
Llama-3.3-Nemotron-Super-49B-v1-FP8 是一個大型語言模型,基於 Meta Llama-3.3-70B-Instruct 衍生而來,經過優化以增強推理能力、對話偏好和任務執行能力,支持 128K 令牌的上下文長度。
下載量 81
發布時間 : 5/13/2025

模型概述

該模型通過神經架構搜索(NAS)方法優化了精度和效率的平衡,適用於 AI 代理系統、聊天機器人、RAG 系統等應用。

模型特點

高效推理
通過神經架構搜索(NAS)方法優化模型結構,實現精度和效率的平衡,適合高負載環境下的單 GPU 部署。
多階段訓練
經過監督微調和強化學習(RL)階段,增強數學、代碼、推理和對話能力。
長上下文支持
支持 128K 令牌的上下文長度,適合處理複雜任務和大規模數據。

模型能力

文本生成
推理任務
代碼生成
數學問題求解
多語言支持

使用案例

AI 代理系統
聊天機器人
用於構建高性能的對話系統,支持多輪對話和複雜指令。
在 IFEval 基準測試中達到 86.70 的嚴格指令分數。
教育
數學問題求解
用於解答覆雜的數學問題,支持逐步推理和答案生成。
在 MATH500 基準測試中達到 95.6 的 pass@1 分數。
編程輔助
代碼生成
生成符合描述的 Python 程序,並通過測試用例。
在 LiveCodeBench 基準測試中達到 41.22 的分數。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase