S

Sage Fredt5 Large

由 ai-forever 开发
基于FRED-T5-large训练的俄语拼写检查模型,可纠正拼写、标点和大小写错误
下载量 189
发布时间 : 3/11/2024

模型简介

该模型通过将文本中的所有单词规范为俄语标准,纠正拼写、标点错误和打字错误。基于FRED-T5-large架构训练,训练数据包含人工生成的错误样本。

模型特点

多错误类型纠正
可同时处理拼写错误、标点错误和大小写错误
基于合成数据训练
使用SAGE库自动生成训练数据中的错误样本
多领域适应
在多个领域的测试集上表现良好,包括社交媒体、医疗和技术文本

模型能力

俄语拼写纠正
标点符号规范化
大小写修正
打字错误纠正

使用案例

文本处理
社交媒体文本规范化
纠正社交媒体中的非正式拼写和打字错误
在RUSpellRU数据集上F1值达62.2
医疗文本标准化
修正医疗记录中的拼写和专业术语错误
在MedSpellchecker数据集上F1值达42.7
内容审核
用户生成内容检查
自动检测并修正用户提交内容中的语言错误
在MultidomainGold数据集上F1值达46.3
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase