X

Xlsr En Punctuation

由boris開發
基於facebook/wav2vec2-large-xlsr-53在英語通用語音數據集上微調的自動語音識別模型,支持標點預測
下載量 30.28k
發布時間 : 3/2/2022

模型概述

這是一個用於英語自動語音識別(ASR)的Wav2Vec2模型,能夠將語音轉換為文本並自動添加標點符號。

模型特點

多語言預訓練
基於XLSR-53多語言模型微調,具有強大的跨語言表示能力
標點預測
不僅能識別語音內容,還能自動預測並添加標點符號
高準確率
在通用語音英語測試集上達到1.0%的詞錯誤率(WER)

模型能力

英語語音識別
自動標點預測
16kHz音頻處理

使用案例

語音轉錄
會議記錄自動生成
將會議錄音自動轉換為帶標點的文字記錄
準確率高,減少人工校對工作量
播客字幕生成
為英語播客自動生成帶標點的字幕文件
支持SRT等常見字幕格式輸出
輔助技術
語音輸入系統
為殘障人士提供高精度的語音輸入解決方案
提高輸入效率和準確性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase