M

Macbert4csc Base Chinese

shibing624によって開発
MacBERTに基づく中国語スペル訂正モデルで、SIGHAN2015テストセットで現在の最適水準に達しています。
ダウンロード数 9,623
リリース時間 : 3/2/2022

モデル概要

このモデルは中国語テキストのスペルミスの検出と訂正に特化しており、改良されたMacBERTアーキテクチャを採用しており、様々な中国語テキストの校正シーンに適用できます。

モデル特徴

最適性能
SIGHAN2015テストセットで文字レベルのF1値89.91、文レベルのF1値77.89の現在の最適水準に達しています。
改良アーキテクチャ
softmaskedbertを改良したMacBERTアーキテクチャで、MLM校正事前学習タスクによりモデルの性能を最適化します。
包括的な学習データ
SIGHAN + Wang271K中国語訂正データセットを使用して学習し、27万件の高品質な訂正サンプルを含んでいます。

モデル能力

中国語のスペルミスの検出
中国語テキストの自動訂正
誤字の識別と修正

使用事例

テキスト校正
日常テキストの訂正
チャット、メールなどの日常テキストのスペルミスを自動的に訂正します。
例:「今天新情很好」 → 「今天心情很好」
正式文書の校正
レポート、論文などの正式文書の文字の正確性を補助的にチェックします。
教育支援
中国語学習支援
中国語学習者が作文中の誤りを識別して訂正するのを支援します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase