W

Wav2vec2 FR 3K Large

Developed by LeBenchmark
2.9K時間のフランス語音声で訓練された大型wav2vec2モデルで、自発的な音声、朗読音声、放送音声の処理をサポートします。
Downloads 948
Release Time : 3/2/2022

Model Overview

このモデルはLeBenchmarkシリーズの大型フランス語音声処理モデルで、wav2vec2アーキテクチャに基づいており、さまざまなフランス語音声タスクに適しています。

Model Features

多種類の音声サポート
自発的な音声、朗読音声、放送音声など、さまざまなフランス語音声タイプの処理をサポートします。
大規模訓練データ
2.9K時間のフランス語音声データを基に訓練されており、男性1.8K時間/女性1.0K時間/不明0.1K時間のデータが含まれています。
柔軟な統合
FairseqやSpeechBrainなどのツールキットと統合でき、さまざまな下流タスクをサポートします。

Model Capabilities

フランス語音声認識
音声特徴抽出
話者識別
音源分離

Use Cases

音声からテキストへの変換
フランス語音声の文字起こし
フランス語音声の内容をテキストに変換します。
音声分析
話者識別
音声中の異なる話者を識別します。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase