S

Sharif Wav2vec2

SLPLによって開発
Sharif Wav2vec2のペルシャ語向けファインチューニング版で、Common Voiceのペルシャ語サンプルでトレーニングされ、自動音声認識タスクをサポートします。
ダウンロード数 88
リリース時間 : 6/25/2022

モデル概要

このモデルはWav2vec2アーキテクチャに基づく自動音声認識(ASR)モデルで、特にペルシャ語向けにファインチューニングされています。108時間のCommon Voiceペルシャ語サンプルを使用してトレーニングされ、認識精度向上のために5gram言語モデルが統合されています。

モデル特徴

ペルシャ語最適化
ペルシャ語向けに特別にファインチューニングされており、Common Voiceペルシャ語テストセットで6.0%のWERを達成
言語モデル統合
kenlmでトレーニングされた5gram言語モデルを統合し、オンラインASRの精度を向上
効率的な処理
16kHzサンプリングレートの音声入力をサポートし、リアルタイム音声認識アプリケーションに適しています

モデル能力

ペルシャ語音声認識
音声文字起こし
音声からテキストへの変換

使用事例

音声文字起こし
ペルシャ語音声からテキスト
ペルシャ語の音声コンテンツをテキストに変換
Common Voiceテストセットで6%の単語誤り率(WER)を達成
音声アシスタント
ペルシャ語音声コマンド認識
ペルシャ語音声アシスタントやスマートホームシステムの音声コマンド認識に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase