W

Wav2vec2 Large Xlsr Arabic Common Voice 10 Epochs

saltiによって開発
wav2vec2アーキテクチャに基づくアラビア語音声認識モデルで、Common Voiceデータセットで10エポックのトレーニングを行った。
ダウンロード数 30
リリース時間 : 3/2/2022

モデル概要

このモデルはアラビア語に最適化された自動音声認識(ASR)モデルで、Facebookのwav2vec2-large-xlsrアーキテクチャに基づき、Common Voiceアラビア語データセットでトレーニングされています。

モデル特徴

アラビア語最適化
アラビア語音声認識タスクに特化して最適化トレーニングを行った。
wav2vec2アーキテクチャに基づく
Facebookのwav2vec2-large-xlsrアーキテクチャを採用し、強力な音声特徴抽出能力を持つ。
効率的なトレーニング
たった10エポックのトレーニングで良好な結果が得られ、検証損失は0.3581、単語誤り率は0.4555です。

モデル能力

アラビア語音声をテキストに変換
連続音声認識
音声特徴抽出

使用事例

音声書き起こし
アラビア語音声の文字起こし
アラビア語の音声内容をテキストに変換する
単語誤り率0.4555
音声アシスタント
アラビア語音声指令認識
アラビア語音声アシスタントの基礎認識コンポーネントとして使用する
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase