P

Prunedbert L12 H256 A4 Finetuned

由eli4s開發
基於BERT架構的輕量級模型,通過知識蒸餾技術預訓練,隱藏層維度為256,配備4個注意力頭。
下載量 16
發布時間 : 3/2/2022

模型概述

該模型是對bert-base-uncased進行剪枝和知識蒸餾微調後的輕量級版本,適用於掩碼語言建模任務。

模型特點

輕量級設計
隱藏層維度為256,僅為BERT的三分之一,模型更輕量。
知識蒸餾
通過知識蒸餾技術從bert-base-uncased模型遷移知識,保持性能的同時減小模型尺寸。
剪枝初始化
模型權重通過對bert-base-uncased模型權重進行剪枝初始化,優化模型結構。
多損失函數微調
採用多損失函數進行知識蒸餾微調,提升模型性能。

模型能力

掩碼語言預測
文本補全
語義理解

使用案例

自然語言處理
文本補全
預測句子中被掩碼的詞彙,用於文本自動補全。
能夠準確預測被掩碼的詞彙,提升文本處理的效率。
語義分析
通過掩碼語言建模任務,理解句子的語義。
能夠有效捕捉句子的語義信息,適用於下游NLP任務。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase