P

Punctuate All

由kredor開發
基於xlm-roberta-base微調的多語言標點符號預測模型,支持12種歐洲語言的標點符號自動補全
下載量 728.70k
發布時間 : 4/9/2022

模型概述

該模型用於自動預測和補全文本中的標點符號,特別適用於語音轉文字後的標點符號恢復場景。相比原版模型,本版本支持更多語言但使用更小的基礎模型。

模型特點

多語言支持
支持12種歐洲語言的標點符號預測,比原版模型增加8種語言
高效模型
使用xlm-roberta-base而非large版本,在保持較好性能的同時降低計算資源需求
高準確率
在常見標點符號(如句號、逗號)上達到0.85-0.95的F1分數

模型能力

標點符號自動補全
多語言文本處理
語音轉文字後處理

使用案例

語音轉錄增強
會議記錄自動標點
將語音識別輸出的無標點文本自動添加標點符號
可準確恢復95%的句號和86%的逗號
文本預處理
機器翻譯預處理
為無標點的原始文本添加標點符號以提高翻譯質量
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase