S

Sage Mt5 Large

由ai-forever開發
基於mT5-large架構的俄語和英語拼寫檢查模型,通過規範化單詞糾正拼寫錯誤和打字錯誤。
下載量 51
發布時間 : 3/11/2024

模型概述

該模型用於糾正俄語和英語中的拼寫錯誤和打字錯誤,將文本中的所有單詞規範化為語言標準。基於mT5-large架構訓練,訓練語料庫包含人工引入錯誤的廣泛數據集。

模型特點

多語言支持
支持俄語和英語的拼寫檢查和文本規範化。
基於mT5-large架構
利用強大的mT5-large架構進行文本生成任務。
合成錯誤訓練
訓練數據包含人工引入的拼寫錯誤和打字錯誤,提高模型魯棒性。
廣泛數據集評估
在多個俄語和英語拼寫檢查基準數據集上進行了全面評估。

模型能力

俄語拼寫檢查
英語拼寫檢查
文本規範化
打字錯誤糾正

使用案例

文本處理
社交媒體文本糾正
自動糾正社交媒體帖子中的拼寫錯誤和打字錯誤。
在RUSpellRU數據集上達到61.4的F1值
醫療文本規範化
糾正醫療病史中的專業術語拼寫錯誤。
在MedSpellchecker數據集上達到47.0的F1值
代碼註釋糾錯
糾正GitHub代碼提交中的拼寫錯誤。
在GitHubTypoCorpusRu數據集上達到50.4的F1值
多領域應用
多領域文本糾正
處理來自新聞、社交媒體、文學作品等多個領域的文本錯誤。
在MultidomainGold數據集上達到43.9的F1值
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase