A

Arabic Speech Recognition

mohammedによって開発
facebook/wav2vec2-large-xlsr-53モデルを微調整したアラビア語自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
ダウンロード数 37
リリース時間 : 3/2/2022

モデル概要

このモデルは、アラビア語音声認識用に設計された自動音声認識(ASR)システムで、Wav2Vec2アーキテクチャに基づき、Common Voiceとアラビア語音声コーパスのトレーニングセットを使って微調整されています。

モデル特徴

アラビア語最適化
アラビア語の音声特性に合わせて専用に微調整されており、アラビア語の発音と変音符号をより良く認識できます。
言語モデル不要
直接使用でき、追加の言語モデルのサポートが不要です。
複数データセットによるトレーニング
Common Voiceとアラビア語音声コーパスを組み合わせてトレーニングされ、モデルの汎化能力が向上します。

モデル能力

アラビア語音声認識
自動音声テキスト変換
16kHzサンプリングレートの音声処理

使用事例

音声文字起こし
アラビア語音声を文字に変換
アラビア語の音声内容をテキスト形式に変換します。
テストのWERは36.69%です。
音声アシスタント
アラビア語音声指令認識
アラビア語の音声アシスタントまたは制御システムの音声指令認識に使用します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase