W

Wav2vec2 Large Xlsr 53 Es

pcuenqによって開発
Facebookのwav2vec2-large-xlsr-53モデルをベースに、スペイン語Common Voiceデータセットで微調整した音声認識モデルで、テストWERは10.50%です。
ダウンロード数 147
リリース時間 : 3/2/2022

モデル概要

これはスペイン語に最適化された自動音声認識(ASR)モデルで、スペイン語の音声をテキストに変換することができます。

モデル特徴

低単語誤り率
Common Voiceスペイン語テストセットで10.50%のWERを達成しました
変音符号を保持
スペイン語の変音符号を保持し、意味の正確性を確保します
言語モデル不要
直接使用でき、追加の言語モデルのサポートは必要ありません
多段階訓練
段階的な訓練戦略を採用し、モデルの性能を段階的に最適化します

モデル能力

スペイン語音声認識
16kHzオーディオ処理
バッチ音声テキスト変換

使用事例

音声文字起こし
スペイン語音声をテキストに変換
スペイン語の音声内容をテキスト形式に変換します
精度約89.5% (WER 10.5%)
音声アシスタント
スペイン語音声指令認識
スペイン語音声アシスタントの基本的な認識コンポーネントに使用されます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase