W

Wav2vec2 French Phonemizer

由Cnam-LMSSC開發
這是一個針對法語語音轉音素任務微調的模型,基於facebook/wav2vec2-base-fr-voxpopuli-v2模型,使用Common Voice v13數據集進行訓練。
下載量 9,832
發布時間 : 11/8/2023

模型概述

該模型能夠將法語語音轉換為國際音標(IPA)編碼的音素序列,為語音處理相關任務提供支持。

模型特點

特定任務微調
專門針對法語語音轉音素任務進行優化,提高了在該任務上的性能
多數據集驗證
在Common Voice v13和Multilingual Librispeech等多個數據集上測試表現良好
高質量音標輸出
輸出為國際音標(IPA)編碼,可直接用於語音合成等下游任務

模型能力

法語語音識別
音素轉換
語音處理

使用案例

語音處理
語音轉音素
將法語語音轉換為音素序列
音素錯誤率(PER)在Common Voice v13上為5.52%,在Multilingual Librispeech上為4.36%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase