A

Asr Wav2vec2 Commonvoice Fr

speechbrainによって開発
CommonVoiceフランス語データセットを基に訓練されたwav2vec 2.0音声認識モデルで、CTC/Attentionアーキテクチャを使用し、言語モデルは不要です。
ダウンロード数 250
リリース時間 : 3/2/2022

モデル概要

これはエンドツーエンドのフランス語自動音声認識システムで、事前学習されたwav2vec 2.0モデルを微調整したもので、フランス語の音声をテキストに変換するタスクに適しています。

モデル特徴

事前学習モデルの微調整
LeBenchmark/wav2vec2-FR-7K-large事前学習モデルを基に微調整を行い、フランス語の認識精度を向上させました。
言語モデル不要
システムは直接CTC貪欲デコーダを使用し、追加の言語モデルのサポートは必要ありません。
効率的な訓練
2台のV100 32GB GPUを使用するだけで訓練を完了でき、リソース消費が比較的低いです。

モデル能力

フランス語音声認識
音声文字起こし
16kHzサンプリングレートの処理

使用事例

音声をテキストに変換
フランス語音声の文字起こし
フランス語の音声内容をテキストに変換します。
テストWER 9.96%、CER 3.19%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase