W

Wav2vec2 Large Xlsr Egyptian

othrifによって開発
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたエジプトアラビア語自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
ダウンロード数 19
リリース時間 : 3/2/2022

モデル概要

このモデルはエジプトアラビア語に最適化された自動音声認識(ASR)モデルで、XLSR-53アーキテクチャを基にファインチューニングされており、エジプトアラビア語の音声からテキストへの変換タスクに適しています。

モデル特徴

エジプトアラビア語最適化
エジプトアラビア語方言に特化してファインチューニングされており、この方言の音声特徴をより正確に認識できます。
言語モデル不要
追加の言語モデルを必要とせず直接使用可能で、導入プロセスを簡素化します。
16kHzサンプリングレート対応
標準的な16kHzサンプリングレートの音声入力をサポートし、一般的な音声収集デバイスと互換性があります。

モデル能力

エジプトアラビア語音声認識
音声からテキストへの変換
自動音声認識

使用事例

音声文字起こし
エジプトアラビア語音声文字起こし
エジプトアラビア語の音声内容をテキストに変換
arabicspeech.org MGB-3データセットでWER55.2を達成
音声アシスタント
エジプトアラビア語音声コマンド認識
エジプトアラビア語対応の音声アシスタントやスマートデバイス向け
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase