W

Wav2vec2 Large Xlsr Arabic

mohammedによって開発
アラビア語音声認識に対して微調整されたWav2Vec2 - Large - XLSR - 53大規模モデルで、Common VoiceとArabic Speech Corpusデータセットを基に訓練されました。
ダウンロード数 51
リリース時間 : 3/2/2022

モデル概要

このモデルはfacebook/wav2vec2 - large - xlsr - 53を基に微調整されたアラビア語自動音声認識(ASR)モデルで、16kHzサンプリングレートの音声入力認識をサポートしています。

モデル特徴

アラビア語最適化
アラビア語の音声特性に特化して微調整され、変音符号や特殊文字を処理できます。
言語モデル不要
音声認識に直接使用でき、追加の言語モデルのサポートが不要です。
複数データセット訓練
Common VoiceとArabic Speech Corpusの2つのデータセットを組み合わせて訓練され、汎化能力が向上します。

モデル能力

アラビア語音声認識
音声をテキストに変換
16kHzサンプリングレート処理

使用事例

音声文字起こし
アラビア語音声を文字に変換
アラビア語の音声内容を文字記録に変換します。
テストセットの単語誤り率36.699%
音声アシスタント
アラビア語音声指令認識
アラビア語音声アシスタントの基本的な認識機能に使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase