B

Bert L12 H384 A6

Developed by eli4s
基于BookCorpus数据集通过知识蒸馏技术预训练的轻量化BERT模型,隐藏层维度缩减至384,采用6个注意力头。
Downloads 16
Release Time : 3/2/2022

Model Overview

该模型是一个轻量化的BERT变体,通过知识蒸馏技术进行预训练,适用于掩码语言建模任务。

Model Features

轻量化设计
隐藏层维度缩减至384(相当于BERT的一半),并采用6个注意力头,保持每个头的维度与BERT一致。
知识蒸馏
通过知识蒸馏技术进行预训练,采用多重损失函数进行优化。
随机初始化
模型权重采用随机初始化方式生成。

Model Capabilities

掩码语言预测
文本理解

Use Cases

自然语言处理
文本补全
预测句子中被掩码的单词。
可生成多个候选词供选择。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase