X

Xls R 300m Ur Cv7

HarrisDePerceptronによって開発
このモデルは、facebook/wav2vec2-xls-r-300mをMOZILLA - FOUNDATION/COMMON_VOICE_7_0 - URデータセットで微調整したウルドゥー語自動音声認識(ASR)モデルです。
ダウンロード数 19
リリース時間 : 3/2/2022

モデル概要

ウルドゥー語の音声をテキストに変換するタスクに使用する自動音声認識モデルで、Common Voiceウルドゥー語データセットで訓練されています。

モデル特徴

高精度なウルドゥー語認識
Common Voiceウルドゥー語評価セットで0.72の単語誤り率(WER)を達成しました。
大規模事前学習モデルに基づく
facebookのwav2vec2-xls-r-300mモデルを微調整しており、強力な音声特徴抽出能力を持っています。
オープンソースライセンス
Apache 2.0ライセンスを採用しており、商用および研究用途での使用が許可されています。

モデル能力

ウルドゥー語音声をテキストに変換
連続音声認識
音声内容の文字起こし

使用事例

音声文字起こし
ウルドゥー語音声内容の文字起こし
ウルドゥー語の音声内容を編集可能なテキスト形式に変換します。
単語誤り率0.72
音声アシスタント
ウルドゥー語音声指令認識
ウルドゥー語音声アシスタントシステムでの音声指令認識に使用します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase