W

Wav2vec2 Large Xlsr 53 German Cv9

oliverguhrによって開発
これはFacebookのwav2vec2-large-xlsr-53モデルを基に、ドイツ語Common Voice 9.0データセットでファインチューニングした自動音声認識(ASR)モデルです。
ダウンロード数 98
リリース時間 : 6/13/2022

モデル概要

このモデルはドイツ語音声認識タスク専用で、Common Voice 9.0ドイツ語テストセットでWER 9.48、CER 1.92という優れた性能を達成しました。

モデル特徴

高性能ドイツ語音声認識
Common Voice 9.0ドイツ語テストセットでWERはわずか9.48、CERは1.92
大規模事前学習モデルベース
Facebookのwav2vec2-large-xlsr-53モデルをファインチューニングしており、強力な音声表現能力を継承
言語モデル融合対応
言語モデル(LM)と組み合わせると、WERをさらに7.49まで低下可能

モデル能力

ドイツ語音声認識
音声からテキストへ
自動音声転写

使用事例

音声転写
ドイツ語音声転写
ドイツ語音声コンテンツをテキストに変換
WER 9.48, CER 1.92
音声アシスタント
ドイツ語音声コマンド認識
ドイツ語音声アシスタントでの音声コマンド認識に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase