D

Distilbert Punctuator Zh

由Qishuai開發
基於DistilBertForTokenClassification微調的中文標點恢復模型,專為無標點中文文本添加標點符號
下載量 103
發布時間 : 3/2/2022

模型概述

該模型是在蒸餾版bert-base-chinese基礎上微調的,用於自動為簡體中文無標點文本添加標點符號

模型特點

輕量級模型
基於DistilBert的蒸餾版本,在保持性能的同時減少模型大小
多標點支持
支持逗號、頓號、歎號、句號、問號等多種中文標點符號的恢復
新聞語料訓練
使用2014年《人民日報》新聞語料進行訓練,適合正式文本場景

模型能力

中文標點恢復
文本自動標點
無標點文本處理

使用案例

文本處理
語音轉文字後處理
為語音識別系統輸出的無標點文本添加標點符號
提高文本可讀性
古籍數字化
為古代文獻數字化過程中產生的無標點文本添加現代標點
便於現代讀者閱讀
新聞處理
新聞稿件處理
自動為記者快速錄入的無標點新聞稿件添加標點
提升編輯效率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase