W

Wav2vec Test

othrifによって開発
facebook/wav2vec2-large-xlsr-53をファインチューニングしたエジプトアラビア語自動音声認識モデルで、arabicspeech.org MGB-3データセットでトレーニングされています。
ダウンロード数 27
リリース時間 : 3/2/2022

モデル概要

このモデルはエジプトアラビア語に最適化された自動音声認識(ASR)モデルで、アラビア語音声をテキストに変換できます。

モデル特徴

エジプトアラビア語最適化
エジプトアラビア語方言に特化してファインチューニングされ、認識精度が向上しています
XLSRモデルベース
facebookのwav2vec2-large-xlsr-53モデルをベースにファインチューニングされており、強力な音声特徴抽出能力を備えています
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力をサポートし、一般的な音声アプリケーションに適しています

モデル能力

アラビア語音声認識
エジプト方言認識
音声からテキストへの変換

使用事例

音声文字起こし
エジプトアラビア語音声転写
エジプトアラビア語の音声内容をテキストに変換
MGB-3テストセットでWER55.2を達成
音声アシスタント
エジプト方言音声インタラクション
エジプト地域のユーザーに方言音声インタラクション機能を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase