R

Russian Text Normalizer

由saarus72開發
基於FRED-T5-large微調的俄語文本規範化模型,支持數字和拉丁字符的規範化處理
下載量 577
發布時間 : 1/6/2024

模型概述

該模型用於將俄語文本中的數字和拉丁字符轉換為規範的俄語表達形式,適用於文本預處理和自然語言處理任務

模型特點

數字規範化
將數字轉換為俄語文本表達形式,支持多種數字格式
拉丁字符轉寫
將拉丁字符(如英文單詞)轉寫為俄語發音近似表達
靈活輸入格式
支持方括號標記和特殊標記的組合輸入方式
多數據源訓練
基於ficbook、librusec和pikabu等多個俄語數據集訓練

模型能力

數字轉俄語文本
拉丁字符轉俄語發音
文本規範化處理
俄語文本預處理

使用案例

文本處理
金融文本處理
將金融文檔中的數字金額轉換為俄語文本表達
142 990 → сто сорок две тысячи девятьсот девяносто
產品名稱轉寫
將產品英文名稱轉寫為俄語發音近似表達
iphone 12 → айфон двенадцатый
電話號碼處理
將電話號碼數字轉換為俄語表達
8 9 555 35 35 → восемь девять миллионов пятьсот пятьдесят пять тысяч тридцать пять
內容創作
小說創作輔助
幫助作家將數字和外來詞自動轉換為規範的俄語表達
3 сына → три сына
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase