W

Wav2vec2 Large Xlsr 53 German With Lm

aware-aiによって開発
これはXLSR Wav2Vec2アーキテクチャに基づくドイツ語自動音声認識モデルで、言語モデルサポートを備えており、Common Voiceドイツ語データセットで優れた性能を発揮します。
ダウンロード数 19
リリース時間 : 3/2/2022

モデル概要

このモデルはドイツ語音声認識タスクに使用され、音響モデルと言語モデルを組み合わせて、ドイツ語音声を効率的かつ正確にテキストに変換できます。

モデル特徴

低単語誤り率
Common Voiceドイツ語テストセットで5.75%のWERと1.90%のCERを達成
言語モデル統合
kenlm言語モデルを組み合わせ、認識精度を向上
XLSRアーキテクチャベース
大規模な自己教師あり事前学習済みXLSR Wav2Vec2モデルを使用

モデル能力

ドイツ語音声認識
音声からテキストへの変換
高精度な音声文字起こし

使用事例

音声文字起こし
ドイツ語音声の書き起こし
ドイツ語音声コンテンツをテキスト形式に変換
高精度な文字起こし結果、WERはわずか5.75%
音声アシスタント
ドイツ語音声コマンド認識
ドイツ語音声アシスタントや制御システムの音声認識コンポーネントとして使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase