W

Wav2vec2 Large Xls R 300m German With Lm

mfleckによって開発
facebook/wav2vec2-xls-r-300mをCommon Voiceドイツ語データセットでファインチューニングした音声認識モデル、n-gram言語モデルを統合、単語誤り率8.8%
ダウンロード数 26
リリース時間 : 3/10/2022

モデル概要

このモデルはドイツ語に最適化された自動音声認識(ASR)システムで、ドイツ語音声をテキストに変換するのに適しています。

モデル特徴

言語モデル強化
n-gram言語モデルを統合し認識精度を向上
高性能
Common Voice評価セットで8.8%の単語誤り率を達成
大規模事前学習
3億パラメータのXLS-Rアーキテクチャをファインチューニング

モデル能力

ドイツ語音声認識
長音声処理(チャンク処理対応)

使用事例

音声からテキストへ
会議議事録
ドイツ語会議録音を文字記録に変換
高精度な転記テキスト
メディア字幕生成
ドイツ語動画コンテンツに自動字幕を生成
5秒音声ブロック処理対応
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase