S

Sage Fredt5 Large

ai-foreverによって開発
FRED-T5-largeでトレーニングされたロシア語スペルチェックモデル。スペルミス、句読点、大文字小文字の誤りを修正可能
ダウンロード数 189
リリース時間 : 3/11/2024

モデル概要

このモデルはテキスト内の全ての単語をロシア語標準に正規化し、スペルミス、句読点の誤り、タイプミスを修正します。FRED-T5-largeアーキテクチャでトレーニングされ、訓練データには人工的に生成された誤りサンプルが含まれています。

モデル特徴

複数誤りタイプ修正
スペルミス、句読点の誤り、大文字小文字の誤りを同時に処理可能
合成データに基づく訓練
SAGEライブラリを使用して訓練データの誤りサンプルを自動生成
マルチドメイン適応
ソーシャルメディア、医療、技術テキストなど複数領域のテストセットで良好な性能

モデル能力

ロシア語スペル修正
句読点正規化
大文字小文字修正
タイプミス修正

使用事例

テキスト処理
ソーシャルメディアテキスト正規化
ソーシャルメディアの非公式スペルやタイプミスを修正
RUSpellRUデータセットでF1値62.2を達成
医療テキスト標準化
医療記録のスペルや専門用語の誤りを修正
MedSpellcheckerデータセットでF1値42.7を達成
コンテンツモデレーション
ユーザー生成コンテンツチェック
ユーザー投稿コンテンツの言語誤りを自動検出・修正
MultidomainGoldデータセットでF1値46.3を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase