W

Wav2vec2 Large Xls R 300m Arabic

phantomcoder1996によって開発
これは現代標準アラビア語に対して微調整されたwav2vec2-large-xlsr-300mモデルで、自動音声認識タスクに特化しています。
ダウンロード数 23
リリース時間 : 3/2/2022

モデル概要

このモデルはwav2vec2アーキテクチャに基づいており、アラビア語音声認識に特化して最適化されており、アラビア語音声をテキストに変換するアプリケーションシナリオに適しています。

モデル特徴

アラビア語最適化
現代標準アラビア語に特化して微調整され、アラビア語音声認識の精度を向上させました。
大規模事前学習
3億パラメータの大規模XLS - Rモデルに基づいており、強力な音声特徴抽出能力を持っています。
複数データセット評価
Common Voice 7.0とロバスト音声コンテストデータセットで全面的な評価が行われました。

モデル能力

アラビア語音声認識
音声からテキストへの変換
自動音声文字起こし

使用事例

音声文字起こし
アラビア語音声から文字への変換
アラビア語音声内容を自動的に文字記録に変換します
Common Voice 7.0テストセットでの単語誤り率は57.8です
音声アシスタント
アラビア語音声指令認識
アラビア語音声アシスタントまたは制御システムの音声指令認識に使用されます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase