C

Chinese Macbert Large

由hfl開發
MacBERT是一種改進的中文BERT模型,採用M作為校正的掩碼語言模型預訓練任務,緩解了預訓練與微調階段的不一致問題。
下載量 13.05k
發布時間 : 3/2/2022

模型概述

MacBERT是一種改進的中文BERT模型,通過使用相似詞進行掩碼而非傳統的[MASK]標記,結合全詞掩碼、N-gram掩碼和句子順序預測等技術,提升了中文自然語言處理任務的性能。

模型特點

校正式MLM
使用相似詞進行掩碼而非[MASK]標記,緩解預訓練與微調階段的不一致問題
全詞掩碼
採用全詞掩碼技術,提升模型對中文詞語的理解能力
N-gram掩碼
支持N-gram級別的掩碼,增強模型對長文本的理解
句子順序預測
整合句子順序預測任務,提升模型對文本連貫性的理解

模型能力

中文文本理解
文本分類
命名實體識別
問答系統
文本相似度計算

使用案例

自然語言處理
中文文本分類
用於中文文本的情感分析、主題分類等任務
命名實體識別
識別中文文本中的人名、地名、機構名等實體
問答系統
構建中文問答系統,回答基於文本的問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase