W

Wav2vec2 Large Xlsr 53 German

marcelによって開発
facebook/wav2vec2-large-xlsr-53をベースに、Common Voiceのドイツ語データセットで微調整した自動音声認識モデルで、テストのWERは15.80%です。
ダウンロード数 25
リリース時間 : 3/2/2022

モデル概要

これはドイツ語に最適化された自動音声認識モデルで、ドイツ語の音声をテキストに変換することができます。

モデル特徴

高精度なドイツ語認識
Common Voiceのドイツ語テストセットで15.80%のWER(単語誤り率)を達成しました。
XLSR事前学習モデルをベースとした
facebook/wav2vec2-large-xlsr-53モデルを微調整しており、強力な音声特徴抽出能力を持っています。
言語モデル不要
直接使用でき、追加の言語モデルのサポートは必要ありません。

モデル能力

ドイツ語音声認識
音声をテキストに変換
16kHzオーディオ処理

使用事例

音声文字起こし
ドイツ語音声の文字起こし
ドイツ語の音声内容をテキスト形式に変換します。
単語誤り率15.80%
音声アシスタント
ドイツ語音声指令の認識
ドイツ語の音声アシスタントシステムでの音声指令の理解に使用します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase