S

Sage M2m100 1.2B

ai-foreverによって開発
M2M100-1.2Bモデルを基に訓練されたロシア語スペルチェッカーで、スペルミスやタイプミスを修正します
ダウンロード数 184
リリース時間 : 3/11/2024

モデル概要

このモデルはテキスト内の全ての単語をロシア語標準に正規化することで、スペルミスやタイプミスを修正します。訓練データセットにはロシア語ウィキペディアとロシア語動画の文字起こしを基に構築された、'人工的'な誤りを含む広範なデータセットが採用されています。

モデル特徴

多分野対応
ソーシャルメディア、医療、技術文書など、様々な分野のロシア語データセットで良好な性能を発揮
高精度修正
RUSpellRUデータセットで88.8%の精度と71.5%の再現率を達成
大規模モデル基盤
12億パラメータのM2M100モデルをファインチューニングしており、優れた言語理解能力を有する

モデル能力

ロシア語スペルチェック
タイプミス修正
テキスト正規化

使用事例

テキスト処理
ソーシャルメディアテキスト修正
ソーシャルメディアにおける非標準スペルやタイプミスの修正
RUSpellRUデータセットでF1値79.2を達成
医療テキスト標準化
医療記録中の専門用語のスペルミス修正
MedSpellcheckerデータセットでF1値74.9を達成
技術文書処理
コードコメント修正
GitHubコードコミット中のスペルミス修正
GitHubTypoCorpusRuデータセットでF1値44.9を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase