P

Punctuation Fullstop Truecase English

由1-800-BAD-CODE開發
該模型專為英文文本設計,能夠同時完成標點恢復、大小寫校正和句子邊界檢測任務。
下載量 427
發布時間 : 3/11/2023

模型概述

接收無標點的小寫英文文本,一次性完成標點恢復、首字母大寫和句子分段。支持特殊縮寫詞和任意大小寫形式的單詞處理。

模型特點

多任務一體化處理
同時完成標點恢復、大小寫校正和句子邊界檢測三項任務
特殊縮寫詞處理
通過專用類別預測帶標點的縮寫(如U.S.)
靈活大小寫支持
多標籤預測機制支持處理NATO、McDonald's等特殊大小寫形式
高效長文本處理
支持自動分段處理超過256子詞的文本

模型能力

文本標點恢復
首字母大寫校正
句子邊界檢測
特殊縮寫識別
非正式文本處理

使用案例

文本規範化
新聞稿件處理
將無標點的新聞草稿轉換為規範格式
標點恢復F1 97.21,大小寫校正F1 99.50
對話文本整理
處理聊天記錄等非正式文本
支持常見縮寫和口語表達
數據預處理
NLP管道預處理
為下游任務準備規範化文本
自動分句準確率99.09
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase