A

Asr Wav2vec2 Commonvoice Fr

由speechbrain開發
基於CommonVoice法語數據集訓練的wav2vec 2.0語音識別模型,使用CTC/Attention架構,無需語言模型
下載量 250
發布時間 : 3/2/2022

模型概述

這是一個端到端的法語自動語音識別系統,基於預訓練的wav2vec 2.0模型微調,適用於法語語音轉文本任務。

模型特點

預訓練模型微調
基於LeBenchmark/wav2vec2-FR-7K-large預訓練模型進行微調,提高了法語識別準確率
無需語言模型
系統直接使用CTC貪婪解碼器,不需要額外的語言模型支持
高效訓練
使用2塊V100 32GB GPU即可完成訓練,資源消耗相對較低

模型能力

法語語音識別
音頻轉錄
16kHz採樣率處理

使用案例

語音轉文本
法語語音轉錄
將法語語音內容轉換為文本
測試WER 9.96%,CER 3.19%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase