B

Bert L12 H384 A6

由 eli4s 开发
基于BookCorpus数据集通过知识蒸馏技术预训练的轻量化BERT模型,隐藏层维度缩减至384,采用6个注意力头。
下载量 16
发布时间 : 3/2/2022

模型简介

该模型是一个轻量化的BERT变体,通过知识蒸馏技术进行预训练,适用于掩码语言建模任务。

模型特点

轻量化设计
隐藏层维度缩减至384(相当于BERT的一半),并采用6个注意力头,保持每个头的维度与BERT一致。
知识蒸馏
通过知识蒸馏技术进行预训练,采用多重损失函数进行优化。
随机初始化
模型权重采用随机初始化方式生成。

模型能力

掩码语言预测
文本理解

使用案例

自然语言处理
文本补全
预测句子中被掩码的单词。
可生成多个候选词供选择。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase