W

Wav2vec2 Large Xls R 1b Swedish

kingabzproによって開発
このモデルは、facebook/wav2vec2-xls-r-1bをCommon Voiceのスウェーデン語データセットで微調整した自動音声認識モデルで、スウェーデン語の音声をテキストに変換するタスクをサポートしています。
ダウンロード数 844
リリース時間 : 3/2/2022

モデル概要

スウェーデン語に最適化された自動音声認識モデルで、wav2vec2-xls-r-1bアーキテクチャに基づき、Common Voice 8.0データセットで微調整され、高精度のスウェーデン語音声認識をサポートします。

モデル特徴

高性能なスウェーデン語認識
Common Voiceのスウェーデン語テストセットで、14.04%の単語誤り率(WER)と4.86%の文字誤り率(CER)を達成しました。
大規模モデルに基づく微調整
10億パラメータのwav2vec2-xls-r-1bモデルを微調整しており、強力な音声特徴抽出能力を備えています。
言語モデルの統合をサポート
言語モデルを組み合わせることで、認識精度をさらに向上させることができ、言語モデルを使用しない場合と比べて、WERを約4%低下させます。

モデル能力

スウェーデン語音声認識
音声をテキストに変換
長い音声データの処理(ブロック処理をサポート)

使用事例

音声文字起こし
スウェーデン語音声内容の文字起こし
スウェーデン語の音声内容をテキスト形式に変換します。
Common Voiceテストセットで14.04%のWERを達成しました。
音声アシスタント
スウェーデン語音声指令の認識
スウェーデン語の音声アシスタントシステムでの指令認識に使用されます。
ロバストな音声イベントデータセットで29.69%のWERを達成しました。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase