W

Wav2vec2 Xls R 1b German

jonatasgrosmanによって開発
これはXLS - R 1Bアーキテクチャに基づくドイツ語自動音声認識モデルで、Common Voice 8.0などの複数のドイツ語音声データセットで微調整されています。
ダウンロード数 105
リリース時間 : 3/2/2022

モデル概要

このモデルはドイツ語音声認識タスクに特化して最適化されており、ドイツ語音声をテキストに変換することができ、16kHzサンプリングレートのオーディオ入力をサポートします。

モデル特徴

高性能ドイツ語認識
Common Voice 8.0テストセットで10.95%のWERと2.72%のCERを達成しました。
言語モデルによる強化
言語モデルを組み合わせると、WERを8.13%、CERを2.18%に下げることができます。
複数データセットによる訓練
Common Voice 8.0、Multilingual TEDx、Multilingual LibriSpeech、Voxpopuliなどの複数のデータセットを使用して訓練されています。

モデル能力

ドイツ語音声認識
自動音声からテキストへの変換
16kHzサンプリングレートのオーディオ処理をサポート

使用事例

音声文字起こし
ドイツ語音声の文字起こし
ドイツ語音声内容をテキスト形式に変換します。
Common Voiceテストセットで90%以上の正解率を達成しました。
音声アシスタント
ドイツ語音声指令認識
ドイツ語音声アシスタントまたはスマートホーム機器の音声指令認識に使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase