S

Sage M2m100 1.2B

由ai-forever開發
基於M2M100-1.2B模型訓練的俄語拼寫檢查器,用於糾正拼寫錯誤和打字錯誤
下載量 184
發布時間 : 3/11/2024

模型概述

該模型通過將文本中的所有單詞規範為俄語標準來糾正拼寫錯誤和打字錯誤。訓練語料庫採用了包含'人工'錯誤的廣泛數據集,基於俄語維基百科和俄語視頻轉錄構建。

模型特點

多領域適用
在多個不同領域的俄語數據集上表現良好,包括社交媒體、醫療和技術文本
高精度糾正
在RUSpellRU數據集上達到88.8%的精確率和71.5%的召回率
基於大模型
基於1.2B參數的M2M100模型微調,具有較強的語言理解能力

模型能力

俄語拼寫檢查
打字錯誤糾正
文本規範化

使用案例

文本處理
社交媒體文本糾正
糾正社交媒體中的非標準拼寫和打字錯誤
在RUSpellRU數據集上F1值達79.2
醫療文本標準化
糾正醫療病史中的專業術語拼寫錯誤
在MedSpellchecker數據集上F1值達74.9
技術文檔處理
代碼註釋糾錯
糾正GitHub代碼提交中的拼寫錯誤
在GitHubTypoCorpusRu數據集上F1值達44.9
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase