Distilbert Punctuator En
D
Distilbert Punctuator En
Developed by Qishuai
基於DistilBERT微調的英文文本標點恢復模型,專為無標點的小寫英文文本添加標點符號。
Downloads 55
Release Time : 3/2/2022
Model Overview
該模型能夠自動為無標點的小寫英文文本添加逗號、句號、問號和感嘆號等標點符號,提升文本可讀性。
Model Features
高效輕量
基於DistilBERT架構,在保持較高性能的同時減少模型大小和計算資源需求
多源訓練數據
整合BBC新聞、新聞文章和TED演講三種不同來源的文本數據,增強模型泛化能力
標點類型覆蓋
支持恢復逗號、句號、問號和感嘆號四種常見英文標點符號
Model Capabilities
英文文本標點恢復
無標點文本處理
小寫文本規範化
Use Cases
文本預處理
語音轉文字後處理
為語音識別系統輸出的無標點文本添加標點符號
提升轉錄文本的可讀性和後續處理效果
新聞文本規範化
處理網絡抓取的無標點新聞文本
使新聞內容更符合出版標準
輔助寫作
快速寫作輔助
為快速輸入的無標點文本自動添加標點
提高寫作效率,減少後期編輯工作
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 Chinese
R
uer
2,694
98