W

Wav2vec2 Large Xlsr 53 Arabic

elgeishによって開発
facebook/wav2vec2-large-xlsr-53をベースに微調整されたアラビア語自動音声認識モデルで、16kHzサンプリングレートの音声入力に対応しています。
ダウンロード数 994
リリース時間 : 3/2/2022

モデル概要

このモデルはアラビア語に最適化された自動音声認識システムで、XLSRアーキテクチャを採用し、Common Voiceとアラビア語音声コーパスで微調整トレーニングを行っています。

モデル特徴

アラビア語最適化
アラビア語の音声特性に合わせて特別に微調整され、バックワルト転写システムを使用してアラビア語テキストを処理します。
二段階トレーニング
まずアラビア語音声コーパスで事前トレーニングを行い、次にCommon Voiceデータセットで微調整を行い、認識精度を最適化します。
言語モデル不要
直接使用でき、追加の言語モデルのサポートは必要ありません。

モデル能力

アラビア語音声認識
16kHzサンプリングレートのオーディオ処理
アラビア語音声の自動転写

使用事例

音声転写
アラビア語音声をテキストに転写
アラビア語の音声内容を自動的にテキストに転写します。
Common Voiceテストセットで26.55%の単語誤り率(WER)に達しました。
音声アシスタント
アラビア語音声指令認識
アラビア語音声アシスタントシステムの音声指令認識に使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase