L

Llama 3 3 Nemotron Super 49B V1 FP8

由 nvidia 开发
Llama-3.3-Nemotron-Super-49B-v1-FP8 是一个大型语言模型,基于 Meta Llama-3.3-70B-Instruct 衍生而来,经过优化以增强推理能力、对话偏好和任务执行能力,支持 128K 令牌的上下文长度。
下载量 81
发布时间 : 5/13/2025

模型简介

该模型通过神经架构搜索(NAS)方法优化了精度和效率的平衡,适用于 AI 代理系统、聊天机器人、RAG 系统等应用。

模型特点

高效推理
通过神经架构搜索(NAS)方法优化模型结构,实现精度和效率的平衡,适合高负载环境下的单 GPU 部署。
多阶段训练
经过监督微调和强化学习(RL)阶段,增强数学、代码、推理和对话能力。
长上下文支持
支持 128K 令牌的上下文长度,适合处理复杂任务和大规模数据。

模型能力

文本生成
推理任务
代码生成
数学问题求解
多语言支持

使用案例

AI 代理系统
聊天机器人
用于构建高性能的对话系统,支持多轮对话和复杂指令。
在 IFEval 基准测试中达到 86.70 的严格指令分数。
教育
数学问题求解
用于解答复杂的数学问题,支持逐步推理和答案生成。
在 MATH500 基准测试中达到 95.6 的 pass@1 分数。
编程辅助
代码生成
生成符合描述的 Python 程序,并通过测试用例。
在 LiveCodeBench 基准测试中达到 41.22 的分数。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase