W

Wav2vec2 Xls R 300m Es

samitizerxuによって開発
このモデルは、facebook/wav2vec2-xls-r-300mをCOMMON_VOICE - ESデータセットでファインチューニングしたスペイン語自動音声認識モデルです。
ダウンロード数 23
リリース時間 : 3/2/2022

モデル概要

スペイン語自動音声認識用のファインチューニングモデルで、wav2vec2-xls-r-300mアーキテクチャに基づき、汎用音声データセットでトレーニングされています。

モデル特徴

複数データセット評価
Common Voice 7と頑健音声イベントデータセットで包括的に評価されています
中規模モデル
3億パラメータのwav2vec2-xls-rアーキテクチャに基づき、性能と効率のバランスを取っています
スペイン語最適化
スペイン語音声認識タスクに特化してファインチューニングされています

モデル能力

スペイン語音声認識
連続音声からテキストへの変換
多様なシナリオでの音声処理

使用事例

音声文字起こし
スペイン語音声から文字へ
スペイン語音声コンテンツを文字に変換
Common Voice 7テストセットで37.37% WERを達成
音声アシスタント
スペイン語音声コマンド認識
スペイン語音声コマンドを認識・理解
頑健音声イベントテストセットで57.28% WERを達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase