A

Asr Transformer Aishell

由speechbrain開發
基於SpeechBrain框架預訓練的AISHELL(普通話)端到端自動語音識別系統,採用Transformer編碼器+聯合解碼器結構
下載量 76
發布時間 : 3/2/2022

模型概述

這是一個用於普通話自動語音識別的Transformer模型,基於AISHELL數據集訓練,能夠將中文語音轉換為文本。

模型特點

聯合解碼機制
結合CTC和Transformer解碼器,在解碼過程中融合CTC概率得分,提高識別準確率
子詞單元分詞
使用基於unigram算法的分詞器,將詞語轉換為子詞單元,提高模型對詞彙的泛化能力
自動音頻處理
內置音頻標準化處理,包括自動重採樣和單聲道選擇,簡化使用流程

模型能力

普通話語音識別
音頻轉錄
批量語音處理

使用案例

語音轉錄
中文會議記錄
將中文會議錄音自動轉換為文字記錄
測試集CER為6.04%
語音輸入系統
為中文應用提供語音輸入功能
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase