C

Chinese Macbert Base

由hfl開發
MacBERT是通過新型MLM作為糾錯的掩碼語言模型預訓練任務改進的BERT模型,緩解了預訓練與微調階段的差異問題。
下載量 22.48k
發布時間 : 3/2/2022

模型概述

MacBERT是一種改進的中文BERT模型,通過使用相似詞進行掩碼而非傳統的[MASK]標記,減少了預訓練與微調階段的差異。

模型特點

糾錯式MLM
使用相似詞進行掩碼,而非傳統的[MASK]標記,減少預訓練與微調階段的差異。
全詞掩碼
採用全詞掩碼技術,提高模型對完整詞彙的理解能力。
N-gram掩碼
支持N-gram掩碼,增強模型對連續詞彙的處理能力。
句子順序預測
整合句子順序預測(SOP)任務,提升模型對句子結構的理解。

模型能力

文本理解
文本生成
文本分類
命名實體識別
問答系統

使用案例

自然語言處理
中文文本分類
用於中文文本的情感分析、主題分類等任務。
命名實體識別
識別中文文本中的人名、地名、機構名等實體。
問答系統
構建中文問答系統,回答用戶提出的問題。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase