W

Wav2vec2 Large Xls Ar

mohamed1aiによって開発
facebook/wav2vec2-large-xlsr-53モデルを基にファインチューニングしたアラビア語自動音声認識モデルで、Common Voiceアラビア語データセットでテストしたWERは52%です。
ダウンロード数 30
リリース時間 : 3/2/2022

モデル概要

これはアラビア語自動音声認識(ASR)のためのモデルで、Facebookのwav2vec2-large-xlsr-53アーキテクチャを基にファインチューニングされており、アラビア語音声をテキストに変換することをサポートします。

モデル特徴

高精度アラビア語認識
アラビア語に最適化された音声認識モデルで、Common VoiceテストセットでWER52%を達成
言語モデル不要
追加の言語モデルサポートなしで直接使用可能
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力を処理するために特別に最適化

モデル能力

アラビア語音声認識
音声テキスト変換
リアルタイム音声処理

使用事例

音声文字起こし
アラビア語音声転写
アラビア語音声コンテンツをテキスト形式に変換
Common Voiceテストセットで52% WERを達成
音声アシスタント
アラビア語音声コマンド認識
アラビア語音声アシスタントや音声制御アプリケーションに使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase