W

Wav2vec2 Large Xlsr 53 German

Developed by Noricum
wav2vec-large-xlsr-53フレームワークを基に微調整されたドイツ語音声認識モデルで、CommonVoiceドイツ語テストセットで11.26%の単語誤り率を達成しました。
Downloads 33
Release Time : 3/2/2022

Model Overview

このモデルはドイツ語音声の文字起こしタスクに特化しており、ドイツ語の音声をテキストに変換することができ、自動音声認識が必要なアプリケーションシナリオに適しています。

Model Features

高い精度
CommonVoiceドイツ語テストセットで11.26%の低い単語誤り率(WER)を達成しました。
大規模事前学習モデルを基に
wav2vec-large-xlsr-53フレームワークを基に微調整され、強力な音声特徴抽出能力を引き継いでいます。
専用のドイツ語最適化
ドイツ語の音声の特徴に合わせて最適化された訓練を行っています。

Model Capabilities

ドイツ語音声認識
音声からテキストへの変換
自動音声文字起こし

Use Cases

音声文字起こしサービス
会議記録の自動化
ドイツ語の会議録音を自動的に文字記録に変換します。
精度約88.74%
音声アシスタント
ドイツ語の音声アシスタントに音声認識能力を提供します。
障害者支援サービス
リアルタイム字幕生成
ドイツ語のビデオコンテンツにリアルタイム字幕を生成します。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase