W

Wav2vec2 Large Xlsr 53 Persian

jonatasgrosmanによって開発
ペルシア語に最適化されたXLSR - 53大規模モデルの音声認識システムで、facebook/wav2vec2-large-xlsr-53アーキテクチャに基づいて微調整されています。
ダウンロード数 257.76k
リリース時間 : 3/2/2022

モデル概要

このモデルはXLSR - 53アーキテクチャに基づいて最適化されたペルシア語音声認識システムで、一般音声6.1ペルシア語データセットを使用してトレーニングされ、ペルシア語の音声をテキストに変換するタスクに適しています。

モデル特徴

高性能ペルシア語認識
一般音声ペルシア語テストセットで30.12%の単語誤り率と7.37%の文字誤り率を達成しました。
XLSR - 53アーキテクチャに基づく
大規模な自己教師付き事前学習のXLSR - 53モデルを利用して微調整します。
16kHzサンプリングレートのサポート
16kHzサンプリングレートの音声入力に特化して最適化されています。

モデル能力

ペルシア語音声認識
音声をテキストに変換
音声の文字起こし

使用事例

音声文字起こし
ペルシア語音声をテキストに変換
ペルシア語の音声内容をテキスト形式に変換します。
一般音声テストセットで30.12%の単語誤り率を達成しました。
音声アシスタント
ペルシア語音声コマンド認識
ペルシア語音声アシスタントの音声コマンド理解に使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase