W

Wav2vec2 Large Xlsr Persian

m3hrdadfiによって開発
facebook/wav2vec2-large-xlsr-53を基にペルシア語(Farsi)でファインチューニングした自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
ダウンロード数 562
リリース時間 : 3/2/2022

モデル概要

これはペルシア語に最適化された自動音声認識モデルで、XLSRアーキテクチャをCommon Voiceペルシア語データセットでファインチューニングして作成されました。

モデル特徴

ペルシア語最適化
ペルシア語の音声特性に特化してファインチューニングされ、認識精度を向上させています
言語モデル不要
追加の言語モデルサポートなしで直接使用可能
16kHzサンプリングレート対応
標準的な16kHzサンプリングレートの音声入力をサポート

モデル能力

ペルシア語音声認識
音声からテキストへの変換
自動音声転写

使用事例

音声転写
ペルシア語音声からテキストへ
ペルシア語の音声内容をテキスト形式に変換
単語誤り率32.20%
音声アシスタント
ペルシア語音声コマンド認識
ペルシア語音声アシスタントシステムのコマンド認識に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase