W

Wav2vec2 Large Xlsr German

maxidlによって開発
Facebookのwav2vec2-large-xlsr-53モデルをベースに、Common Voiceドイツ語データセットで微調整された自動音声認識(ASR)モデル
ダウンロード数 253
リリース時間 : 3/2/2022

モデル概要

これはドイツ語に最適化された自動音声認識モデルで、ドイツ語の音声をテキストに変換でき、音声を文字に変換する必要があるアプリケーションシーンに適しています。

モデル特徴

高精度ドイツ語認識
Common Voiceドイツ語テストセットで12.77%のWER(単語誤り率)を達成しました。
XLSRアーキテクチャに基づく
facebook/wav2vec2-large-xlsr-53をベースモデルとして使用し、強力な音声特徴抽出能力を持っています。
言語モデル不要
直接使用でき、追加の言語モデルのサポートは必要ありません。

モデル能力

ドイツ語音声認識
16kHz音声処理
バッチ音声をテキストに変換

使用事例

音声転写
ドイツ語会議記録
ドイツ語の会議録音を自動的に文字記録に変換します。
精度約87.23%(12.77% WERに基づく)
音声アシスタント
ドイツ語の音声アシスタントに音声認識能力を提供します。
教育
言語学習アプリ
学習者がドイツ語の発音と聴解を練習するのを支援します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase