W

Wav2vec2 Large Xls R 300m Sl With LM V1

DrishtiSharmaによって開発
これはfacebook/wav2vec2-xls-r-300mモデルをベースに、スロベニア語(Common Voice 8.0)データセットで微調整した自動音声認識(ASR)モデルで、言語モデル(LM)を組み合わせることで認識精度が向上しています。
ダウンロード数 25
リリース時間 : 3/2/2022

モデル概要

このモデルはスロベニア語の音声認識タスクに特化しており、Common Voice 8.0データセットで良好な認識精度を達成しています。

モデル特徴

言語モデル強化
言語モデル(LM)を組み合わせることで、認識精度が大幅に向上し、WERが20.6%から13.5%に低下しました。
多データセット検証
Common Voiceやロバスト音声イベントなどの複数のデータセットで検証されています。
効率的なトレーニング
混合精度トレーニングと線形学習率スケジューラを使用してトレーニングプロセスを最適化しています。

モデル能力

スロベニア語音声認識
長時間音声処理(チャンク処理をサポート)
高い文字認識精度(CER 3.8%)

使用事例

音声文字変換
音声文字起こし
スロベニア語の音声を文字に変換します。
Common VoiceテストセットでWER 13.5%
音声アシスタント
音声コマンド認識
スロベニア語の音声コマンドを認識します。
ロバスト音声イベントテストセットでWER 46.17%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase