D

Dots.llm1.inst

由 rednote-hilab 开发
dots.llm1 是一个大规模的 MoE 模型,在 1420 亿总参数中激活 140 亿参数,性能可与最先进的模型相媲美。
下载量 440
发布时间 : 5/14/2025

模型简介

dots.llm1 是一个开源的大规模 MoE 模型,具有高效的数据处理管道和高性能推理能力,支持英语和中文。

模型特点

高效的数据处理
采用三阶段数据处理框架,生成大规模、高质量和多样化的预训练数据。
无合成数据预训练
基础模型预训练使用了 1.12 万亿高质量的非合成标记。
高性能与成本效率
推理时仅激活 140 亿参数,兼具全面的能力和高计算效率。
创新的基础设施
引入基于交错 1F1B 流水线调度和高效分组 GEMM 实现的创新 MoE 全对全通信和计算重叠方案。
开放的模型动态
发布了每 1 万亿标记训练的中间模型检查点,便于研究大语言模型的学习动态。

模型能力

文本生成
对话系统
代码生成

使用案例

自然语言处理
文本补全
用于生成连贯的文本补全,适用于写作辅助、内容生成等场景。
对话系统
用于构建智能对话系统,提供自然流畅的对话体验。
编程辅助
代码生成
用于生成代码片段,如快速排序算法的实现。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase