W

Wav2vec2 Large Xlsr 53 Arabic

jonatasgrosmanによって開発
facebook/wav2vec2-large-xlsr - 53をベースに微調整されたアラビア語音声認識モデルで、Common Voiceとアラビア語音声コーパスで訓練されました。
ダウンロード数 2.3M
リリース時間 : 3/2/2022

モデル概要

アラビア語に最適化された自動音声認識(ASR)モデルで、16kHzサンプリングレートの音声入力をテキストに変換できます。

モデル特徴

高性能アラビア語認識
Common Voiceアラビア語テストセットで39.59%のWERと18.18%のCERを達成し、同類のアラビア語ASRモデルより優れています。
複数データセットでの訓練
Common Voice 6.1とアラビア語音声コーパスを組み合わせて訓練することで、モデルの汎化能力を向上させます。
即時使用可能なモデル
追加の言語モデルなしで直接使用でき、デプロイプロセスを簡素化します。

モデル能力

アラビア語音声認識
16kHzオーディオ処理
長い音声の文字起こし

使用事例

音声から文字への変換
音声メモの文字起こし
アラビア語の音声メモを検索可能なテキストに変換します。
精度約80%(CERに基づく推測)
カスタマーサービスの会話記録
アラビア語のカスタマーサービス通話内容を自動記録します。
支援技術
聴覚障害者支援
聴覚障害者にリアルタイム字幕を提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase