M

Mdlm Owt

由 kuleshov-group 开发
基于扩散过程的掩码语言模型,规模与GPT2-medium相近,通过前向扩散过程训练,能够从不同掩码级别重建原始输入。
下载量 13.14k
发布时间 : 6/6/2024

模型简介

该模型是一种掩码扩散语言模型,通过前向扩散过程进行训练,能够处理从完全掩码到完全未掩码的不同输入级别,并在此过程中重建原始输入。

模型特点

扩散过程训练
通过前向扩散过程训练,生成从完全掩码到完全未掩码的不同输入级别。
大规模训练
在OpenWebText语料库上进行了100万步训练,处理了330亿个标记。
高效重建
能够从不同掩码级别中有效重建原始输入并输出逻辑值。

模型能力

掩码语言建模
文本重建

使用案例

自然语言处理
文本补全
对部分掩码的文本进行补全和重建。
语言模型预训练
作为预训练模型用于下游NLP任务。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase