W

Wav2vec2 Large Xlsr 53 Dutch

jonatasgrosmanによって開発
facebook/wav2vec2-large-xlsr-53をファインチューニングしたオランダ語音声認識モデルで、Common VoiceとCSS10データセットでトレーニングされ、16kHz音声入力に対応しています。
ダウンロード数 3.0M
リリース時間 : 3/2/2022

モデル概要

オランダ語に最適化された自動音声認識(ASR)モデルで、XLSR-53アーキテクチャに基づき、オランダ語音声をテキストに変換するのに適しています。

モデル特徴

複数データセットでのトレーニング
Common Voice 6.1とCSS10データセットのトレーニングセットと検証セットを使用してファインチューニングされています
言語モデルサポート
言語モデルと組み合わせて使用可能で、認識精度が大幅に向上します(WERが15.72から12.84に改善)
効率的な音声処理
16kHzサンプリングレートの音声入力に対応し、リアルタイム音声認識シナリオに適しています

モデル能力

オランダ語音声認識
音声からテキストへの変換
言語モデルを伴う拡張認識に対応

使用事例

音声文字起こし
オランダ語音声の文字起こし
オランダ語の音声コンテンツをテキスト形式に変換します
テストセットWER 15.72/CER 5.35
音声アシスタント
オランダ語音声コマンド認識
音声アシスタントやスマートホームデバイスのオランダ語コマンド認識に使用できます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase