Z

Zh Wiki Punctuation Restore

由p208p2002開發
一個用於中文維基百科文本的標點符號恢復工具,支持恢復6種常見標點符號。
下載量 102.99k
發布時間 : 1/31/2023

模型概述

該模型專門設計用於中文維基百科文本的標點符號恢復,能夠自動為無標點的中文文本添加逗號、頓號、句號、問號、感嘆號和分號。

模型特點

多標點支持
支持恢復6種常見中文標點符號:逗號、頓號、句號、問號、感嘆號和分號
維基百科優化
專門針對中文維基百科文本進行優化,恢復效果更準確
滑動窗口處理
採用滑動窗口技術處理長文本,確保長文檔也能準確恢復標點

模型能力

中文標點恢復
文本規範化
長文本處理

使用案例

文本處理
維基百科文本規範化
為無標點的維基百科文本添加標點符號
使文本更易讀,符合出版標準
OCR後處理
處理OCR識別後丟失標點的中文文本
提高OCR文本的可讀性
數據預處理
NLP任務預處理
為下游NLP任務準備規範化文本
提高後續NLP任務的處理效果
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase