W

Wav2vec2 Large Xlsr 53 Spanish

jonatasgrosmanによって開発
facebook/wav2vec2-large-xlsr-53モデルを基に微調整されたスペイン語音声認識モデルで、Common Voice 6.1スペイン語データセットで訓練されました。
ダウンロード数 46.28k
リリース時間 : 3/2/2022

モデル概要

スペイン語に最適化された自動音声認識(ASR)モデルで、16kHzサンプリングレートの音声入力をテキストに変換することができます。

モデル特徴

高性能スペイン語認識
Common Voiceスペイン語テストセットで8.82%の単語誤り率(WER)を達成しました。
言語モデル強化
言語モデルを組み合わせることで、単語誤り率を6.27%まで下げることができ、認識精度が大幅に向上します。
XLSR - 53大規模モデルを基に
facebook/wav2vec2-large-xlsr-53モデルを基に微調整されており、強力な音声特徴抽出能力を備えています。

モデル能力

スペイン語音声認識
オーディオをテキストに変換
16kHzサンプリングレートのオーディオ処理をサポート

使用事例

音声文字起こし
音声内容の文字起こし
スペイン語の音声内容をテキスト形式に変換します。
高い精度の文字起こし結果
音声アシスタント
スペイン語音声インタラクション
スペイン語の音声アシスタントに音声認識機能を提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase