X

Xlsr Large 53 Ur

HarrisDePerceptronによって開発
このモデルは、facebook/wav2vec2-large-xlsr-53をベースに、Common Voice 8.0ウルドゥー語データセットで微調整された自動音声認識モデルです。
ダウンロード数 14
リリース時間 : 3/2/2022

モデル概要

ウルドゥー語の音声をテキストに変換するタスクに使用される自動音声認識モデルで、Common Voice 8.0ウルドゥー語データセットで訓練されています。

モデル特徴

ウルドゥー語音声認識
ウルドゥー語に特化して最適化された音声認識能力
wav2vec2アーキテクチャに基づく
facebookのwav2vec2-large-xlsr-53をベースモデルとして使用
Common Voiceデータセットで訓練
Mozilla Common Voice 8.0ウルドゥー語データセットで微調整

モデル能力

ウルドゥー語音声をテキストに変換
自動音声認識

使用事例

音声文字起こし
ウルドゥー語音声文字起こし
ウルドゥー語の音声内容をテキストに変換
テストセットで62.47%の単語誤り率を達成
音声アシスタント
ウルドゥー語音声コマンド認識
ウルドゥー語の音声アシスタントまたは音声制御アプリに使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase