W

Wav2vec2 Large Xlsr 53 German Cv9

Developed by oliverguhr
これはFacebookのwav2vec2-large-xlsr-53モデルを基に、ドイツ語Common Voice 9.0データセットでファインチューニングした自動音声認識(ASR)モデルです。
Downloads 98
Release Time : 6/13/2022

Model Overview

このモデルはドイツ語音声認識タスク専用で、Common Voice 9.0ドイツ語テストセットでWER 9.48、CER 1.92という優れた性能を達成しました。

Model Features

高性能ドイツ語音声認識
Common Voice 9.0ドイツ語テストセットでWERはわずか9.48、CERは1.92
大規模事前学習モデルベース
Facebookのwav2vec2-large-xlsr-53モデルをファインチューニングしており、強力な音声表現能力を継承
言語モデル融合対応
言語モデル(LM)と組み合わせると、WERをさらに7.49まで低下可能

Model Capabilities

ドイツ語音声認識
音声からテキストへ
自動音声転写

Use Cases

音声転写
ドイツ語音声転写
ドイツ語音声コンテンツをテキストに変換
WER 9.48, CER 1.92
音声アシスタント
ドイツ語音声コマンド認識
ドイツ語音声アシスタントでの音声コマンド認識に使用
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase