A

Asr Transformer Transformerlm Librispeech

由speechbrain開發
這是一個基於Transformer架構的自動語音識別(ASR)系統,結合了CTC和Transformer解碼器,在LibriSpeech英文數據集上訓練。
下載量 533
發布時間 : 3/2/2022

模型概述

該模型是一個端到端的自動語音識別系統,包含分詞器、神經語言模型和聲學模型,支持英文語音轉錄。

模型特點

聯合解碼
結合CTC概率和Transformer解碼器進行聯合解碼,提高識別準確率
子詞單元處理
使用unigram分詞器將單詞轉換為子詞單元,提高模型處理能力
高性能
在LibriSpeech測試集上達到2.27(乾淨)和5.53(其他)的詞錯誤率(WER)

模型能力

英文語音識別
音頻轉錄
自動語音識別

使用案例

語音轉錄
音頻文件轉錄
將英文語音文件轉換為文本
高準確率的轉錄結果
語音處理
語音識別系統
集成到語音識別應用中
提供準確的語音轉文本功能
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase