A

Asr Whisper Medium Commonvoice Fa

speechbrainによって開発
CommonVoice-14.0ペルシャ語データセットでファインチューニングされたwhisper mediumモデルで、ペルシャ語自動音声認識タスク用です。
ダウンロード数 21
リリース時間 : 7/20/2023

モデル概要

このモデルはwhisper-mediumアーキテクチャに基づく自動音声認識システムで、ペルシャ語に特化して最適化されており、ペルシャ語の音声をテキストに変換できます。

モデル特徴

事前学習モデルのファインチューニング
事前学習済みのwhisper-mediumモデルをペルシャ語データでファインチューニングしており、元モデルの強力な特徴抽出能力を保持しています
効率的なトレーニング
事前学習済みのwhisperエンコーダーを凍結し、デコーダー部分のみをファインチューニングすることで、トレーニング効率を向上させています
自動音声処理
自動リサンプリングやモノラル選択を含む、組み込みの音声正規化処理機能を備えています

モデル能力

ペルシャ語音声認識
音声文字起こし
音声からテキストへの変換

使用事例

音声文字起こし
ペルシャ語音声からテキストへの変換
ペルシャ語の音声ファイルをテキスト形式に変換します
CommonVoiceテストセットで35.48%の単語誤り率を達成
音声アシスタント
ペルシャ語音声コマンド認識
ペルシャ語音声アシスタントを構築するための基礎認識モジュールとして使用できます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase