R

Rum2m100 1.2B

由ai-forever開發
基於M2M100-1.2B訓練的俄語拼寫檢查模型,能糾正拼寫錯誤和打字錯誤
下載量 407
發布時間 : 7/26/2023

模型概述

該模型通過將文本中的所有單詞規範化為俄語標準形式來糾正拼寫錯誤和打字錯誤,基於包含人工錯誤的廣泛數據集訓練

模型特點

高質量拼寫糾正
在多個測試數據集上表現優於ChatGPT系列模型和開源拼寫檢查器
多領域適用
在普通文本、醫學文本、技術文本等多種領域都有良好表現
基於合成錯誤訓練
使用SAGE庫自動生成訓練數據中的錯誤,覆蓋廣泛的錯誤類型

模型能力

俄語拼寫檢查
打字錯誤糾正
文本規範化

使用案例

文本處理
社交媒體文本糾正
糾正社交媒體中的拼寫錯誤和打字錯誤
在RUSpellRU數據集上F1分數50.1
醫學文本處理
糾正醫學病史中的專業術語拼寫錯誤
在MedSpellChecker數據集上F1分數60.6
技術文檔處理
糾正技術文檔和代碼註釋中的拼寫錯誤
在GitHubTypoCorpusRu數據集上F1分數43.5
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase