W

Wav2vec2 Large Xls R 300m Urdu

omar47によって開発
このモデルはfacebook/wav2vec2-xls-r-300mをファインチューニングしたバージョンで、ウルドゥー語音声認識タスクに特化して最適化されています。
ダウンロード数 27
リリース時間 : 4/29/2022

モデル概要

これはウルドゥー語音声認識のための自動音声認識(ASR)モデルで、wav2vec2-xls-r-300mアーキテクチャを基にファインチューニングされ、評価セットで17.02%の単語誤り率(WER)を達成しました。

モデル特徴

ウルドゥー語最適化
ウルドゥー語の音声特性に特化してファインチューニングされ、認識精度が向上しています
低単語誤り率
評価セットで17.02%の単語誤り率(WER)を達成しました
大規模モデルベースのファインチューニング
facebook/wav2vec2-xls-r-300m大規模モデルを基にファインチューニングされており、強力な音声特徴抽出能力を継承しています

モデル能力

ウルドゥー語音声認識
音声からテキストへの変換
音声文字起こし

使用事例

音声文字起こし
ウルドゥー語会議議事録
ウルドゥー語の会議録音を自動的に文字起こし
約83%の精度
音声アシスタント
ウルドゥー語音声アシスタントアプリケーション向けの音声認識コンポーネント
教育
言語学習アプリ
学習者がウルドゥー語の発音を練習し、フィードバックを受けられるように支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase