S

Sage Fredt5 Distilled 95m

由 ai-forever 开发
基于FRED-T5-1.7B架构的蒸馏模型,用于俄语拼写、标点及大小写错误的自动校正
下载量 1,553
发布时间 : 3/11/2024

模型简介

该模型通过将文本中的所有单词规范化为俄语标准形式,纠正拼写、标点错误及打字错误。训练采用了包含人工错误的广泛数据集,适用于多种文本纠错场景。

模型特点

多错误类型校正
同时处理拼写错误、标点错误和大小写错误
合成数据训练
使用SAGE库自动生成训练数据中的错误,覆盖广泛错误类型
领域适应性
在通用文本和特定领域(如医学)都表现良好

模型能力

俄语拼写校正
标点符号修正
大小写规范化
打字错误纠正

使用案例

文本处理
社交媒体文本校正
修正用户生成内容中的拼写和语法错误
在LiveJournal数据集上F1达到78.9
专业文档校对
自动检查医学文档等专业文本
在医学数据集上F1达到64.9
内容生产
自动字幕校正
修正视频转录文本中的错误
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase