A

Asr Whisper Medium Commonvoice Ar

speechbrainによって開発
CommonVoiceアラビア語データセットでファインチューニングされたWhisper medium音声認識モデル、SpeechBrainチームによって開発
ダウンロード数 17
リリース時間 : 7/20/2023

モデル概要

このモデルはWhisper mediumアーキテクチャに基づく自動音声認識システムで、アラビア語に特化して最適化されており、CommonVoiceアラビア語データセットでファインチューニングされています

モデル特徴

高精度アラビア語認識
CommonVoiceアラビア語テストセットで14.82%のWERを達成
Whisperアーキテクチャベース
OpenAI Whisper medium事前学習モデルを利用してファインチューニング
エンドツーエンド学習
完全なエンコーダ-デコーダアーキテクチャで、直接テキスト結果を出力
自動音声処理
内蔵音声正規化機能(リサンプリング+モノラル選択)

モデル能力

アラビア語音声認識
音声文字起こし
16kHzモノラル音声処理

使用事例

音声文字起こし
アラビア語音声からテキストへ
アラビア語音声コンテンツをテキストに変換
テストセットWER 14.82%、CER 4.95%
音声アシスタント
アラビア語音声コマンド認識
アラビア語音声アシスタントのフロントエンド音声認識モジュールとして使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase