W

Wav2vec2 Large Xls R 300m Urdu

kingabzproによって開発
facebook/wav2vec2-xls-r-300mをCommon Voice 8ウルドゥー語データセットでファインチューニングした音声認識モデル
ダウンロード数 91.36k
リリース時間 : 3/2/2022

モデル概要

このモデルはウルドゥー語に最適化された自動音声認識(ASR)モデルで、wav2vec2アーキテクチャに基づき、Common Voice 8データセットでファインチューニングされており、ウルドゥー語音声からテキストへの変換タスクをサポートします。

モデル特徴

ウルドゥー語最適化
ウルドゥー語音声認識タスクに特化して最適化されています
wav2vec2アーキテクチャ採用
Facebookのwav2vec2-xls-r-300m事前学習モデルをベースにしています
Common Voiceデータセットでファインチューニング
Mozilla Common Voice 8ウルドゥー語データセットでファインチューニングされています

モデル能力

ウルドゥー語音声認識
音声からテキストへの変換
長い音声処理(チャンク処理対応)

使用事例

音声書き起こし
ウルドゥー語音声書き起こし
ウルドゥー語音声コンテンツをテキストに変換
テストセットWER 39.89、CER 16.7
音声アシスタント
ウルドゥー語音声コマンド認識
ウルドゥー語音声アシスタントシステムでのコマンド認識に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase