W

Wav2vec2 FR 3K Large

由LeBenchmark開發
基於2.9K小時法語語音訓練的大型wav2vec2模型,支持自發語音、朗讀語音和廣播語音處理
下載量 948
發布時間 : 3/2/2022

模型概述

該模型是LeBenchmark系列中的大型法語語音處理模型,基於wav2vec2架構,適用於多種法語語音任務

模型特點

多類型語音支持
支持處理自發語音、朗讀語音和廣播語音等多種法語語音類型
大規模訓練數據
基於2.9K小時的法語語音數據進行訓練,包含男性1.8K/女性1.0K/未知0.1K小時數據
靈活集成
可與Fairseq和SpeechBrain等工具包集成,支持多種下游任務

模型能力

法語語音識別
語音特徵提取
說話人識別
聲源分離

使用案例

語音轉文本
法語語音轉錄
將法語語音內容轉換為文本
語音分析
說話人識別
識別語音中的不同說話人
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase