R

Russian Text Normalizer

saarus72によって開発
FRED-T5-largeをファインチューニングしたロシア語テキスト正規化モデルで、数字とラテン文字の正規化処理をサポート
ダウンロード数 577
リリース時間 : 1/6/2024

モデル概要

このモデルはロシア語テキスト内の数字とラテン文字を規範的なロシア語表現に変換するために使用され、テキスト前処理や自然言語処理タスクに適しています

モデル特徴

数字正規化
数字をロシア語テキスト表現に変換し、様々な数字フォーマットをサポート
ラテン文字転記
ラテン文字(英語単語など)をロシア語発音に近い表現に転記
柔軟な入力形式
角括弧マーキングと特殊マーカーの組み合わせ入力方式をサポート
多様なデータソースでのトレーニング
ficbook、librusec、pikabuなどの複数のロシア語データセットでトレーニング

モデル能力

数字からロシア語テキストへの変換
ラテン文字からロシア語発音への変換
テキスト正規化処理
ロシア語テキスト前処理

使用事例

テキスト処理
金融テキスト処理
金融文書内の数字金額をロシア語テキスト表現に変換
142 990 → сто сорок две тысячи девятьсот девяносто
製品名転記
製品の英語名称をロシア語発音に近い表現に転記
iphone 12 → айфон двенадцатый
電話番号処理
電話番号の数字をロシア語表現に変換
8 9 555 35 35 → восемь девять миллионов пятьсот пятьдесят пять тысяч тридцать пять
コンテンツ作成
小説作成支援
作家が数字や外来語を自動的に規範的なロシア語表現に変換するのを支援
3 сына → три сына
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase