W

Whisper Large V3 Persian Common Voice 17

msgholによって開発
Whisper Large v3をベースにファインチューニングしたペルシア語自動音声認識モデルで、Common Voice 17データセットで訓練されており、ペルシア語の認識精度が大幅に向上しています。
ダウンロード数 442
リリース時間 : 3/15/2025

モデル概要

これはペルシア語に特化して最適化された自動音声認識モデルで、OpenAIのWhisper Large v3アーキテクチャを基にしており、Mozilla Common Voice 17のペルシア語サブセットでファインチューニングされています。

モデル特徴

大規模データ訓練
25万以上のペルシア語音声サンプルで訓練されており、以前のバージョン(8.3万サンプル)と比べて認識精度が大幅に向上しています
低単語誤り率
ペルシア語音声認識において21.43の単語誤り率(WER)を達成しました
専門的な最適化
ペルシア語の特性に特化して最適化されており、この言語の認識精度と頑健性が向上しています

モデル能力

ペルシア語音声認識
長い音声処理(30秒のチャンクに対応)

使用事例

音声からテキストへ
ペルシア語会議議事録
ペルシア語の会議録音を自動的にテキスト記録に変換します
精度が向上し、単語誤り率が低下しました
ペルシア語メディア字幕生成
ペルシア語の動画コンテンツに自動的に字幕を生成します
字幕制作の効率が向上しました
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase