W

Wav2vec2 Large Xlsr 53 French

jonatasgrosmanによって開発
これはXLSR - 53大規模モデルを微調整したフランス語音声認識モデルで、Common Voiceデータセットで訓練され、高い精度でフランス語の音声をテキストに変換できます。
ダウンロード数 47.83k
リリース時間 : 3/2/2022

モデル概要

このモデルはフランス語に最適化された自動音声認識(ASR)システムで、Facebookのwav2vec2 - large - xlsr - 53アーキテクチャを微調整しており、フランス語の音声をテキストに変換できます。

モデル特徴

高精度なフランス語認識
Common Voiceフランス語テストセットで17.65%の単語誤り率(WER)と4.89%の文字誤り率(CER)を達成しました。
言語モデルによる強化をサポート
言語モデルを組み合わせると、WERを13.59%、CERを3.91%に下げることができ、認識精度が大幅に向上します。
16kHzサンプリングレートのサポート
16kHzサンプリングレートの音声入力に最適化されており、ほとんどの音声アプリケーションシナリオに適しています。
オープンソースライセンス
Apache - 2.0ライセンスを採用しており、商用および研究用途が許可されています。

モデル能力

フランス語音声認識
リアルタイム音声テキスト変換
バッチオーディオ処理

使用事例

音声文字起こし
フランス語音声を文字に変換
フランス語の音声内容を編集可能なテキスト形式に変換します。
標準テストセットで83%以上の精度を達成しました。
音声アシスタント
フランス語音声指令認識
フランス語の音声アシスタントまたは制御システムの音声指令認識に使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase