W

Wav2vec2 Large Xls R 300m Spanish Small

tomascufaroによって開発
wav2vec2-large-xls-r-300mアーキテクチャに基づくスペイン語音声認識モデルで、汎用音声データセットで微調整され、単語誤り率(WER)は0.1791です。
ダウンロード数 13
リリース時間 : 3/2/2022

モデル概要

これはスペイン語に最適化された自動音声認識(ASR)モデルで、スペイン語の音声をテキストに変換するタスクに適しています。

モデル特徴

低い単語誤り率
評価セットで0.1791の単語誤り率(WER)を達成し、優れた性能を発揮します。
大規模事前学習
3億パラメータの大規模wav2vec2アーキテクチャに基づいており、強力な音声特徴抽出能力を持っています。
スペイン語最適化
スペイン語の音声特性に合わせて特別に微調整され、スペイン語の発音特徴に適応しています。

モデル能力

スペイン語音声認識
音声からテキストへの変換
連続音声処理

使用事例

音声文字起こし
会議記録
スペイン語の会議録音を自動的に文字記録に変換します。
精度約82%
音声アシスタント
スペイン語音声アシスタントの音声認識モジュールに使用されます。
教育
言語学習アプリ
学習者がスペイン語の発音の正確性を確認するのを支援します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase