S

Sage Fredt5 Large

由ai-forever開發
基於FRED-T5-large訓練的俄語拼寫檢查模型,可糾正拼寫、標點和大小寫錯誤
下載量 189
發布時間 : 3/11/2024

模型概述

該模型通過將文本中的所有單詞規範為俄語標準,糾正拼寫、標點錯誤和打字錯誤。基於FRED-T5-large架構訓練,訓練數據包含人工生成的錯誤樣本。

模型特點

多錯誤類型糾正
可同時處理拼寫錯誤、標點錯誤和大小寫錯誤
基於合成數據訓練
使用SAGE庫自動生成訓練數據中的錯誤樣本
多領域適應
在多個領域的測試集上表現良好,包括社交媒體、醫療和技術文本

模型能力

俄語拼寫糾正
標點符號規範化
大小寫修正
打字錯誤糾正

使用案例

文本處理
社交媒體文本規範化
糾正社交媒體中的非正式拼寫和打字錯誤
在RUSpellRU數據集上F1值達62.2
醫療文本標準化
修正醫療記錄中的拼寫和專業術語錯誤
在MedSpellchecker數據集上F1值達42.7
內容審核
用戶生成內容檢查
自動檢測並修正用戶提交內容中的語言錯誤
在MultidomainGold數據集上F1值達46.3
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase