A

Asr Conformer Transformerlm Librispeech

由speechbrain開發
基於SpeechBrain框架的自動語音識別模型,使用Conformer編碼器和Transformer解碼器,在LibriSpeech數據集上訓練,支持英語語音識別。
下載量 984
發布時間 : 6/21/2023

模型概述

該模型是一個端到端的自動語音識別系統,包含分詞器、神經語言模型和聲學模型,能夠將英語語音轉換為文本。

模型特點

聯合解碼
結合CTC和Transformer解碼器,提高識別準確率
高性能
在LibriSpeech測試集上達到2.0% (clean)和4.5% (other)的詞錯誤率
完整工具鏈
提供從訓練到推理的完整工具支持

模型能力

英語語音識別
音頻文件轉錄
批量語音處理

使用案例

語音轉錄
音頻文件轉錄
將英語語音文件轉換為文本
高準確率的轉錄結果
語音處理系統
語音助手
作為語音助手的識別後端
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase