A

Asr Crdnn Commonvoice Fr

由speechbrain開發
這是一個基於CommonVoice法語數據集訓練的端到端自動語音識別系統,採用CRDNN架構結合CTC和注意力機制。
下載量 167
發布時間 : 3/2/2022

模型概述

該模型用於法語語音識別任務,能夠將法語語音轉換為文本,適用於需要法語語音轉寫的應用場景。

模型特點

雙解碼機制
同時使用CTC和注意力機制進行解碼,提高識別準確性
子詞單元分詞
採用unigram分詞器將單詞轉換為子詞單元,提高模型對未見過詞彙的處理能力
自動音頻處理
內置音頻標準化處理,包括自動重採樣和單聲道選擇

模型能力

法語語音識別
音頻轉錄
語音轉文本

使用案例

語音轉錄
法語語音轉寫
將法語語音內容轉換為文本格式
測試集CER 6.54%,WER 17.70%
語音助手
法語語音指令識別
用於法語語音助手或智能家居設備的語音指令識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase