R

Rum2m100 1.2B

ai-foreverによって開発
M2M100-1.2Bをベースに訓練されたロシア語スペルチェックモデルで、スペルミスやタイプミスを修正できます
ダウンロード数 407
リリース時間 : 7/26/2023

モデル概要

このモデルは、テキスト内のすべての単語をロシア語標準形に正規化することでスペルミスやタイプミスを修正し、人工的なエラーを含む広範なデータセットで訓練されています

モデル特徴

高品質なスペル修正
複数のテストデータセットでChatGPTシリーズモデルやオープンソースのスペルチェッカーを上回る性能を発揮
マルチドメイン対応
一般テキスト、医療テキスト、技術テキストなど様々な分野で良好な性能を発揮
合成エラーによるトレーニング
SAGEライブラリを使用してトレーニングデータのエラーを自動生成し、幅広いエラータイプをカバー

モデル能力

ロシア語スペルチェック
タイプミス修正
テキスト正規化

使用事例

テキスト処理
ソーシャルメディアテキスト修正
ソーシャルメディアのスペルミスやタイプミスを修正
RUSpellRUデータセットでF1スコア50.1
医療テキスト処理
病歴の専門用語のスペルミスを修正
MedSpellCheckerデータセットでF1スコア60.6
技術文書処理
技術文書やコードコメントのスペルミスを修正
GitHubTypoCorpusRuデータセットでF1スコア43.5
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase