W

Wav2vec2 Large Xls R 300m Urdu

infinitejoyによって開発
これはfacebook/wav2vec2 - xls - r - 300mをベースに、ウルドゥー語Common Voice 7データセットで微調整された自動音声認識モデルです。
ダウンロード数 15
リリース時間 : 3/2/2022

モデル概要

このモデルは主にウルドゥー語の自動音声認識タスクに使用され、ウルドゥー語の音声をテキストに変換することができます。

モデル特徴

ウルドゥー語音声認識
ウルドゥー語に特化して最適化された音声認識能力
XLS - Rアーキテクチャに基づく
FacebookのXLS - R - 300M事前学習モデルをベースに使用
Common Voiceデータセットでの学習
Mozilla Common Voice 7ウルドゥー語データセットで微調整

モデル能力

ウルドゥー語音声からテキストへの変換
自動音声認識

使用事例

音声文字起こし
ウルドゥー語音声文字起こし
ウルドゥー語の音声内容をテキストに変換
音声アシスタント
ウルドゥー語音声対話
ウルドゥー語音声アシスタントに認識能力を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase