A

Artst Asr V3 Qasr

MBZUAIによって開発
QASRデータセットでファインチューニングされたアラビア語自動音声認識モデルで、特に方言変種に適しています
ダウンロード数 636
リリース時間 : 3/1/2025

モデル概要

このモデルはSpeechT5アーキテクチャに基づくアラビア語自動音声認識(ASR)モデルで、アラビア語の方言変種に最適化されており、MBZUAI音声研究所によって開発されました。

モデル特徴

方言最適化
特にアラビア語の方言変種に最適化されており、非標準アラビア語をより良く認識できます
効率的なアーキテクチャ
SpeechT5アーキテクチャに基づき、認識精度と計算効率のバランスを取っています
QASRデータセットファインチューニング
QASRデータセットを使用してファインチューニングを行い、アラビア語音声の認識能力を向上させました

モデル能力

アラビア語音声認識
方言変種認識
音声からテキストへの変換

使用事例

音声文字起こし
アラビア語会議議事録
アラビア語の会議録音を自動的に文字記録に変換
標準アラビア語と一般的な方言の正確な文字起こしをサポート
メディアコンテンツ字幕生成
アラビア語ビデオコンテンツの字幕を自動生成
方言を含むメディアコンテンツを処理可能
音声アシスタント
アラビア語音声コマンド認識
アラビア語音声アシスタントシステムのコマンド認識モジュール
異なるアクセントや方言のコマンドを理解可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase