W

Wav2vec2 FR 3K Base

由LeBenchmark開發
基於2.9K小時法語語音訓練的wav2vec2基礎模型,支持自發、朗讀和廣播語音
下載量 31
發布時間 : 3/2/2022

模型概述

LeBenchmark提供的wav2vec2基礎模型,在包含自發、朗讀和廣播語音的不同法語數據集上預訓練,適用於語音相關任務

模型特點

多場景語音訓練
模型在包含自發、朗讀和廣播語音的不同法語數據集上預訓練,適應多種語音場景
多種規模選擇
提供從1K到14K小時不同規模的預訓練模型,滿足不同計算資源需求
開源許可
模型根據Apache-2.0許可證分發,可以廣泛重用

模型能力

語音特徵提取
語音表示學習
自動語音識別
說話人識別

使用案例

語音處理
自動語音識別(ASR)
使用CTC對模型進行ASR微調
由於CTC的性質,語音到文本的結果預計不會是最先進的
說話人識別
結合SpeechBrain工具包進行說話人識別或驗證
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase