W

Wav2vec2 FR 3K Large

LeBenchmarkによって開発
2.9K時間のフランス語音声で訓練された大型wav2vec2モデルで、自発的な音声、朗読音声、放送音声の処理をサポートします。
ダウンロード数 948
リリース時間 : 3/2/2022

モデル概要

このモデルはLeBenchmarkシリーズの大型フランス語音声処理モデルで、wav2vec2アーキテクチャに基づいており、さまざまなフランス語音声タスクに適しています。

モデル特徴

多種類の音声サポート
自発的な音声、朗読音声、放送音声など、さまざまなフランス語音声タイプの処理をサポートします。
大規模訓練データ
2.9K時間のフランス語音声データを基に訓練されており、男性1.8K時間/女性1.0K時間/不明0.1K時間のデータが含まれています。
柔軟な統合
FairseqやSpeechBrainなどのツールキットと統合でき、さまざまな下流タスクをサポートします。

モデル能力

フランス語音声認識
音声特徴抽出
話者識別
音源分離

使用事例

音声からテキストへの変換
フランス語音声の文字起こし
フランス語音声の内容をテキストに変換します。
音声分析
話者識別
音声中の異なる話者を識別します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase