W

Wav2vec2 Large Xlsr 53 German

Noricumによって開発
wav2vec-large-xlsr-53フレームワークを基に微調整されたドイツ語音声認識モデルで、CommonVoiceドイツ語テストセットで11.26%の単語誤り率を達成しました。
ダウンロード数 33
リリース時間 : 3/2/2022

モデル概要

このモデルはドイツ語音声の文字起こしタスクに特化しており、ドイツ語の音声をテキストに変換することができ、自動音声認識が必要なアプリケーションシナリオに適しています。

モデル特徴

高い精度
CommonVoiceドイツ語テストセットで11.26%の低い単語誤り率(WER)を達成しました。
大規模事前学習モデルを基に
wav2vec-large-xlsr-53フレームワークを基に微調整され、強力な音声特徴抽出能力を引き継いでいます。
専用のドイツ語最適化
ドイツ語の音声の特徴に合わせて最適化された訓練を行っています。

モデル能力

ドイツ語音声認識
音声からテキストへの変換
自動音声文字起こし

使用事例

音声文字起こしサービス
会議記録の自動化
ドイツ語の会議録音を自動的に文字記録に変換します。
精度約88.74%
音声アシスタント
ドイツ語の音声アシスタントに音声認識能力を提供します。
障害者支援サービス
リアルタイム字幕生成
ドイツ語のビデオコンテンツにリアルタイム字幕を生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase