R

Rum2m100 1.2B

Developed by ai-forever
基于M2M100-1.2B训练的俄语拼写检查模型,能纠正拼写错误和打字错误
Downloads 407
Release Time : 7/26/2023

Model Overview

该模型通过将文本中的所有单词规范化为俄语标准形式来纠正拼写错误和打字错误,基于包含人工错误的广泛数据集训练

Model Features

高质量拼写纠正
在多个测试数据集上表现优于ChatGPT系列模型和开源拼写检查器
多领域适用
在普通文本、医学文本、技术文本等多种领域都有良好表现
基于合成错误训练
使用SAGE库自动生成训练数据中的错误,覆盖广泛的错误类型

Model Capabilities

俄语拼写检查
打字错误纠正
文本规范化

Use Cases

文本处理
社交媒体文本纠正
纠正社交媒体中的拼写错误和打字错误
在RUSpellRU数据集上F1分数50.1
医学文本处理
纠正医学病史中的专业术语拼写错误
在MedSpellChecker数据集上F1分数60.6
技术文档处理
纠正技术文档和代码注释中的拼写错误
在GitHubTypoCorpusRu数据集上F1分数43.5
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase