W

Wav2vec2 Large Xlsr Persian V3

m3hrdadfiによって開発
Facebookのwav2vec2-large-xlsr-53モデルをペルシャ語Common Voiceデータセットでファインチューニングした自動音声認識(ASR)モデル
ダウンロード数 1,888
リリース時間 : 3/2/2022

モデル概要

このモデルはペルシャ語(ファルシ語)の音声認識タスク専用で、XLSRアーキテクチャの大規模事前学習とペルシャ語データによるファインチューニングにより高精度な文字起こしを実現

モデル特徴

低単語誤り率
ペルシャ語テストセットで10.36%のWER(単語誤り率)を達成
大規模事前学習
facebook/wav2vec2-large-xlsr-53の多言語事前学習モデルを基盤
専門データによるチューニング
Common Voiceペルシャ語版データを使用したターゲット指向のファインチューニング

モデル能力

ペルシャ語音声認識
16kHz音声処理
長音声文字起こし

使用事例

音声文字起こし
ペルシャ語音声文字変換
ペルシャ語音声コンテンツをテキストに変換
約90%の精度(WER 10.36%)
音声アシスタント
ペルシャ語音声コマンド認識
ペルシャ語音声アシスタントの中核認識機能を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase