A

Asr Wav2vec2 Ctc French

bofenghuangによって開発
これはwav2vec2-FR-7K-largeモデルを基にファインチューニングされたフランス語自動音声認識(ASR)モデルで、2200時間以上のフランス語音声データでトレーニングされています。
ダウンロード数 520
リリース時間 : 11/25/2022

モデル概要

このモデルはフランス語音声認識タスク専用で、16kHzサンプリングレートの音声入力をサポートし、複数のフランス語音声データセットで優れた性能を発揮します。

モデル特徴

複数データセットでのトレーニング
モデルはCommon Voice 11.0、多言語LibriSpeech、Voxpopuliなどの複数のフランス語音声データセットでトレーニングされており、様々な音声シナリオをカバーしています。
言語モデルサポート
モデルは言語モデルと組み合わせて使用でき、単語誤り率(WER)を大幅に低減できます。
アフリカ訛り対応
モデルはアフリカ訛りのフランス語データでトレーニングされており、アフリカ訛りのフランス語を認識できます。

モデル能力

フランス語音声認識
16kHzサンプリングレート音声処理対応
言語モデル統合サポート
多様な音声認識シナリオ対応

使用事例

音声文字起こし
フランス語音声からテキストへ
フランス語音声内容をテキストに変換
Common Voice 11.0テストセットでWERは11.44(言語モデルなし)と9.66(言語モデルあり)
音声分析
アフリカ訛りフランス語認識
アフリカ訛りのフランス語音声を認識
アフリカ訛りフランス語テストセットでWERは16.22(言語モデルなし)と15.39(言語モデルあり)
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase