W

Wav2vec2 Large Xlsr Persian V2

m3hrdadfiによって開発
facebook/wav2vec2-large-xlsr-53をベースに、Common Voiceデータセットを使ってペルシア語(ペルシア語)で微調整された自動音声認識モデル
ダウンロード数 47
リリース時間 : 3/2/2022

モデル概要

これはペルシア語の自動音声認識(ASR)に使用するモデルで、Facebookのwav2vec2-large-xlsr-53アーキテクチャを微調整して作成され、16kHzのサンプリングレートの音声入力をサポートします。

モデル特徴

ペルシア語最適化
ペルシア語に特化して微調整され、ペルシア語の文字処理と標準化を含む
Common Voiceデータセットに基づく
Common Voiceペルシア語データセットを使って訓練と検証を行う
言語モデル不要
追加の言語モデルなしで直接使用できる

モデル能力

ペルシア語音声認識
16kHz音声処理

使用事例

音声文字変換
ペルシア語音声文字起こし
ペルシア語の音声を文字に変換する
テストWERは31.92%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase