A

Asr Crdnn Rnnlm Librispeech

由speechbrain開發
這是一個基於LibriSpeech數據集預訓練的端到端自動語音識別系統,採用CRDNN架構結合CTC/注意力機制和RNN語言模型,在英文語音識別任務上表現優異。
下載量 1,354
發布時間 : 3/2/2022

模型概述

該模型是一個完整的自動語音識別系統,包含分詞器、神經語言模型和聲學模型,能夠將英文語音轉換為文本。

模型特點

多模塊集成
整合了分詞器、RNN語言模型和CRDNN聲學模型,提供完整的語音識別解決方案
雙重解碼機制
同時採用CTC和注意力機制進行解碼,提高識別準確率
高效訓練
在LibriSpeech數據集上訓練,使用卷積神經網絡塊和雙向LSTM提取聲學特徵

模型能力

英語語音識別
音頻轉錄
語音轉文本

使用案例

語音轉錄
音頻文件轉錄
將英語語音文件轉換為文本
在LibriSpeech測試集上達到3.09%的詞錯誤率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase