S

Sage Mt5 Large

ai-foreverによって開発
mT5-largeアーキテクチャに基づくロシア語と英語のスペルチェックモデルで、単語を正規化することでスペルミスやタイプミスを修正します。
ダウンロード数 51
リリース時間 : 3/11/2024

モデル概要

このモデルは、ロシア語と英語のスペルミスやタイプミスを修正し、テキスト中のすべての単語を言語標準に正規化します。mT5-largeアーキテクチャを基に訓練され、訓練コーパスには人為的に導入された誤りを含む広範なデータセットが含まれています。

モデル特徴

多言語対応
ロシア語と英語のスペルチェックとテキスト正規化をサポートします。
mT5-largeアーキテクチャに基づく
強力なmT5-largeアーキテクチャを利用してテキスト生成タスクを行います。
合成誤りによる訓練
訓練データには人為的に導入されたスペルミスやタイプミスが含まれており、モデルのロバスト性を向上させます。
広範なデータセットでの評価
複数のロシア語と英語のスペルチェックベンチマークデータセットで全面的に評価されています。

モデル能力

ロシア語のスペルチェック
英語のスペルチェック
テキスト正規化
タイプミスの修正

使用事例

テキスト処理
ソーシャルメディアテキストの訂正
ソーシャルメディアの投稿に含まれるスペルミスやタイプミスを自動的に修正します。
RUSpellRUデータセットで61.4のF1値を達成しました
医療テキストの正規化
医療履歴に含まれる専門用語のスペルミスを修正します。
MedSpellcheckerデータセットで47.0のF1値を達成しました
コードコメントの訂正
GitHubのコードコミットに含まれるスペルミスを修正します。
GitHubTypoCorpusRuデータセットで50.4のF1値を達成しました
多領域アプリケーション
多領域テキストの訂正
ニュース、ソーシャルメディア、文学作品など複数の領域からのテキストエラーを処理します。
MultidomainGoldデータセットで43.9のF1値を達成しました
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase