C

Chinesebert Large

由junnyu開發
ChineseBERT是一個融合字形與拼音信息的中文預訓練模型,通過增強字形特徵提升中文理解能力
下載量 21
發布時間 : 3/2/2022

模型概述

該模型通過結合漢字字形結構(五筆/筆畫)和拼音信息增強傳統BERT的中文處理能力,適用於中文文本理解與生成任務

模型特點

字形增強
整合漢字五筆編碼和筆畫順序特徵,增強模型對中文形態的理解
拼音融合
結合漢字拼音信息,解決中文同音字歧義問題
預訓練優化
專門針對中文特性設計的預訓練目標,提升語義捕獲能力

模型能力

中文文本理解
掩碼詞預測
中文語義表示學習

使用案例

文本補全
中文完形填空
預測被掩碼的中文詞彙
示例中'北京是[MASK]國的首都'正確預測為'中'(準確率83.41%)
教育應用
中文學習輔助
基於字形特徵的錯別字檢測與糾正
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase