L

Llama 3 3 Nemotron Super 49B V1 FP8

Developed by nvidia
Llama-3.3-Nemotron-Super-49B-v1-FP8 是一个大型语言模型,基于 Meta Llama-3.3-70B-Instruct 衍生而来,经过优化以增强推理能力、对话偏好和任务执行能力,支持 128K 令牌的上下文长度。
Downloads 81
Release Time : 5/13/2025

Model Overview

该模型通过神经架构搜索(NAS)方法优化了精度和效率的平衡,适用于 AI 代理系统、聊天机器人、RAG 系统等应用。

Model Features

高效推理
通过神经架构搜索(NAS)方法优化模型结构,实现精度和效率的平衡,适合高负载环境下的单 GPU 部署。
多阶段训练
经过监督微调和强化学习(RL)阶段,增强数学、代码、推理和对话能力。
长上下文支持
支持 128K 令牌的上下文长度,适合处理复杂任务和大规模数据。

Model Capabilities

文本生成
推理任务
代码生成
数学问题求解
多语言支持

Use Cases

AI 代理系统
聊天机器人
用于构建高性能的对话系统,支持多轮对话和复杂指令。
在 IFEval 基准测试中达到 86.70 的严格指令分数。
教育
数学问题求解
用于解答复杂的数学问题,支持逐步推理和答案生成。
在 MATH500 基准测试中达到 95.6 的 pass@1 分数。
编程辅助
代码生成
生成符合描述的 Python 程序,并通过测试用例。
在 LiveCodeBench 基准测试中达到 41.22 的分数。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase