A

Asr Wav2vec2 Ctc French

由bofenghuang開發
這是一個基於wav2vec2-FR-7K-large模型微調的法語自動語音識別(ASR)模型,在超過2200小時的法語語音數據上訓練而成。
下載量 520
發布時間 : 11/25/2022

模型概述

該模型專門用於法語語音識別任務,支持16kHz採樣率的音頻輸入,在多個法語語音數據集上表現出色。

模型特點

多數據集訓練
模型在Common Voice 11.0、多語言LibriSpeech、Voxpopuli等多個法語語音數據集上訓練,覆蓋多種語音場景。
支持語言模型
模型可與語言模型結合使用,顯著降低詞錯誤率(WER)。
非洲口音支持
模型在非洲口音法語數據上進行了訓練,能夠識別帶有非洲口音的法語。

模型能力

法語語音識別
支持16kHz採樣率音頻處理
支持語言模型集成
多場景語音識別

使用案例

語音轉錄
法語語音轉文字
將法語語音內容轉換為文字
在Common Voice 11.0測試集上WER為11.44(無語言模型)和9.66(有語言模型)
語音分析
非洲口音法語識別
識別帶有非洲口音的法語語音
在非洲口音法語測試集上WER為16.22(無語言模型)和15.39(有語言模型)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase