B

Bert L12 H384 A6

由eli4s開發
基於BookCorpus數據集通過知識蒸餾技術預訓練的輕量化BERT模型,隱藏層維度縮減至384,採用6個注意力頭。
下載量 16
發布時間 : 3/2/2022

模型概述

該模型是一個輕量化的BERT變體,通過知識蒸餾技術進行預訓練,適用於掩碼語言建模任務。

模型特點

輕量化設計
隱藏層維度縮減至384(相當於BERT的一半),並採用6個注意力頭,保持每個頭的維度與BERT一致。
知識蒸餾
通過知識蒸餾技術進行預訓練,採用多重損失函數進行優化。
隨機初始化
模型權重採用隨機初始化方式生成。

模型能力

掩碼語言預測
文本理解

使用案例

自然語言處理
文本補全
預測句子中被掩碼的單詞。
可生成多個候選詞供選擇。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase