S

Sage Fredt5 Distilled 95m

ai-foreverによって開発
FRED-T5-1.7Bアーキテクチャに基づく蒸留モデルで、ロシア語のスペル、句読点、大文字小文字の誤りを自動修正
ダウンロード数 1,553
リリース時間 : 3/11/2024

モデル概要

このモデルはテキスト内の全ての単語をロシア語標準形に正規化し、スペルミス、句読点の誤り、タイプミスを修正します。人工的に生成された誤りを含む広範なデータセットで訓練されており、様々なテキスト修正シナリオに適用可能です。

モデル特徴

複数誤りタイプ修正
スペルミス、句読点の誤り、大文字小文字の誤りを同時に処理
合成データ訓練
SAGEライブラリを使用して訓練データ内の誤りを自動生成し、幅広い誤りタイプをカバー
分野適応性
一般テキストと特定分野(医療など)の両方で良好な性能を発揮

モデル能力

ロシア語スペル修正
句読点修正
大文字小文字正規化
タイプミス修正

使用事例

テキスト処理
ソーシャルメディアテキスト修正
ユーザー生成コンテンツのスペルや文法誤りを修正
LiveJournalデータセットでF1スコア78.9を達成
専門文書校正
医療文書などの専門テキストを自動チェック
医療データセットでF1スコア64.9を達成
コンテンツ制作
自動字幕修正
動画文字起こしテキストの誤りを修正
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase