P

Punctuation Fullstop Truecase English

由 1-800-BAD-CODE 开发
该模型专为英文文本设计,能够同时完成标点恢复、大小写校正和句子边界检测任务。
下载量 427
发布时间 : 3/11/2023

模型简介

接收无标点的小写英文文本,一次性完成标点恢复、首字母大写和句子分段。支持特殊缩写词和任意大小写形式的单词处理。

模型特点

多任务一体化处理
同时完成标点恢复、大小写校正和句子边界检测三项任务
特殊缩写词处理
通过专用类别预测带标点的缩写(如U.S.)
灵活大小写支持
多标签预测机制支持处理NATO、McDonald's等特殊大小写形式
高效长文本处理
支持自动分段处理超过256子词的文本

模型能力

文本标点恢复
首字母大写校正
句子边界检测
特殊缩写识别
非正式文本处理

使用案例

文本规范化
新闻稿件处理
将无标点的新闻草稿转换为规范格式
标点恢复F1 97.21,大小写校正F1 99.50
对话文本整理
处理聊天记录等非正式文本
支持常见缩写和口语表达
数据预处理
NLP管道预处理
为下游任务准备规范化文本
自动分句准确率99.09
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase