M

Mengzi Bert Base

由Langboat開發
基於300G中文語料預訓練的BERT模型,採用MLM、POS和SOP任務訓練
下載量 438
發布時間 : 3/2/2022

模型概述

一個輕量級卻強大的中文預訓練語言模型,適用於多種中文自然語言處理任務

模型特點

中文優化
專門針對中文語言特點進行優化,基於300G中文語料訓練
多任務訓練
採用掩碼語言建模、詞性標註和句子順序預測三種任務聯合訓練
輕量高效
相比同類模型具有更輕量的結構但保持強大的性能

模型能力

文本理解
文本補全
語義分析
句子關係判斷

使用案例

自然語言處理
文本補全
填補文本中的[MASK]位置
如示例所示能準確理解上下文並補全內容
文本分類
對中文文本進行分類
在TNEWS等分類任務上表現優異
語義理解
自然語言推理
判斷句子間的邏輯關係
在CMNLI任務上達到82.12%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase