W

Wav2vec2 FR 3K Base

LeBenchmarkによって開発
2.9K時間のフランス語音声で学習したwav2vec2の基礎モデルで、自発的、朗読、放送音声に対応
ダウンロード数 31
リリース時間 : 3/2/2022

モデル概要

LeBenchmarkが提供するwav2vec2の基礎モデルで、自発的、朗読、放送音声を含む様々なフランス語データセットで事前学習され、音声関連タスクに適しています

モデル特徴

多シーン音声学習
モデルは自発的、朗読、放送音声を含む様々なフランス語データセットで事前学習され、様々な音声シーンに適応します
複数の規模選択
1Kから14K時間までの異なる規模の事前学習モデルを提供し、異なる計算リソースのニーズを満たします
オープンソースライセンス
モデルはApache - 2.0ライセンスに基づいて配布され、広く再利用できます

モデル能力

音声特徴抽出
音声表現学習
自動音声認識
話者認識

使用事例

音声処理
自動音声認識(ASR)
CTCを使用してモデルをASR微調整します
CTCの性質上、音声からテキストへの結果は最先端ではないと予想されます
話者認識
SpeechBrainツールキットを組み合わせて話者認識または検証を行います
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase