X

Xls R 300m Es

polodealvaradoによって開発
スペイン語Common Voiceデータセットでファインチューニングされた音声認識モデル。facebook/wav2vec2-xls-r-300mアーキテクチャ採用。テストセットでWER14.6%を達成
ダウンロード数 23
リリース時間 : 3/2/2022

モデル概要

スペイン語に最適化された自動音声認識(ASR)モデル。XLS-R-300M事前学習モデルをファインチューニングして実現。スペイン語音声からテキストへの変換タスクに適しています。

モデル特徴

高性能スペイン語認識
Common Voice 8.0スペイン語テストセットで14.6%のWER指標を達成
5-gram言語モデル対応
組み込みn-gram(n=5)言語モデルサポートにより、WERを10.9%までさらに低減可能
最適化されたトレーニング設定
線形学習率スケジューリングと混合精度トレーニングを採用し、13エポックの最適化トレーニングを実施

モデル能力

スペイン語音声認識
リアルタイム音声テキスト変換
長音声処理

使用事例

音声文字起こし
スペイン語会議議事録
スペイン語会議録音を自動的に文字記録に変換
認識精度85.4% (WER 14.6)
音声アシスタント開発
スペイン語音声アシスタントや対話システムの開発に使用
音声分析
音声コンテンツ分析
スペイン語音声コンテンツを分析して感情分析やキーワード抽出を実施
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase