M

Macbert4csc Scalarmix Base Chinese

由x180開發
基於MacBERT微調的掩碼語言模型,用於中文錯別字修正
下載量 15
發布時間 : 4/14/2022

模型概述

該模型是在MacBERT基礎上微調的掩碼語言模型,專門用於中文文本的錯別字檢測與修正。通過調整損失權重和引入ScalarMix層等技術改進,提升了錯字檢測能力。

模型特點

改進的損失權重分配
調整MLM與錯字檢測二分類任務的損失權重為0.9:0.1,優化模型學習效果
ScalarMix層融合
在錯字檢測任務中引入ScalarMix層融合各隱層表示,避免過深表徵影響學習效果

模型能力

中文文本糾錯
錯別字檢測
自動文本修正

使用案例

文本處理
中文文檔校對
自動檢測和修正中文文檔中的錯別字
在通用語料測試集上達到72%的準確率
輸入法糾錯
修正用戶輸入時的拼寫錯誤
在SIGHAN2015測試集上達到79.73%的準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase