W

Wav2vec2 Large Xlsr 53 Spanish Ep5 944h

carlosdanielhernandezmenaによって開発
スペイン語自動音声認識用の音響モデルで、facebook/wav2vec2-large-xlsr-53を5エポックにわたってファインチューニングし、約944時間のスペイン語データを使用しています。
ダウンロード数 111
リリース時間 : 12/1/2022

モデル概要

このモデルはスペイン語音声認識専用に設計された音響モデルで、大規模なスペイン語データセットでファインチューニングされており、さまざまなスペイン語音声認識シナリオに適しています。

モデル特徴

複数データセットでのトレーニング
CIEMPIESS-UNAMプロジェクトやその他の公開リポジトリから約944時間のスペイン語データを使用してトレーニングされています
低WER
Mozilla Common Voice 10.0テストセットでWER9.20%など、複数のテストセットで優れた性能を発揮
方言カバレッジ
トレーニングデータにはメキシコ、チリ、コロンビア、ペルー、アルゼンチン、プエルトリコなどのさまざまなスペイン語方言が含まれています

モデル能力

スペイン語音声認識
多方言認識
高精度文字起こし

使用事例

音声文字起こし
放送ニュースの文字起こし
スペイン語放送ニュースコンテンツの文字起こしに使用
HUB4NEテストセットでWER7.48%
電話音声の文字起こし
電話会話内容の文字起こしに使用
CALLHOMEテストセットでWER39.12%
音声アシスタント
スペイン語音声コマンド認識
スペイン語音声アシスタントのコマンド認識に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase