W

Wav2vec2 Xls R 300m Arabic

AndrewMcDowellによって開発
これはfacebook/wav2vec2-xls-r-300mモデルをベースに、アラビア語のCommon Voice 7データセットで微調整した自動音声認識(ASR)モデルです。
ダウンロード数 148
リリース時間 : 3/2/2022

モデル概要

このモデルはアラビア語の自動音声認識タスクに特化しており、Common Voice 7アラビア語データセットで微調整トレーニングを行っています。

モデル特徴

アラビア語音声認識
アラビア語に特化して最適化された音声認識能力
XLS - Rアーキテクチャに基づく
強力なwav2vec2-xls-r-300mアーキテクチャを採用し、300Mパラメータ規模を持つ
Common Voiceデータセットでのトレーニング
Mozilla Common Voice 7アラビア語データセットで微調整

モデル能力

アラビア語音声をテキストに変換
連続音声認識
多領域音声処理

使用事例

音声文字起こし
アラビア語音声の文字起こし
アラビア語の音声内容をテキストに変換
Common Voice 7テストセットでのWERは47.54%です
音声アシスタント
アラビア語音声コマンド認識
アラビア語の音声アシスタントまたは制御システムの音声コマンド認識に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase