# ウルドゥー語音声認識

Indicconformer Stt Ur Hybrid Ctc Rnnt Large
MIT
IndicConformerは、混合CTC-RNNTアーキテクチャに基づくConformer自動音声認識モデルで、ウルドゥー語音声の書き起こしに特化しています。
音声認識 その他
I
ai4bharat
44
2
Wav2vec2 Xls R 300m Ur Cv9 With Lm
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-300mをウルドゥー語音声データセットでファインチューニングした自動音声認識(ASR)モデルです
音声認識 Transformers その他
W
anuragshas
18
1
My Final Wav2vec2 Urdu Asr Project
これはwav2vec2アーキテクチャに基づくウルドゥー語自動音声認識(ASR)モデルで、ゼロからトレーニングされています。
音声認識 Transformers
M
Raffay
24
0
Wav2vec2 Large Xls R 300m Urdu
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-300mをファインチューニングしたバージョンで、ウルドゥー語音声認識タスクに特化して最適化されています。
音声認識 Transformers
W
omar47
27
0
V1 Speech Processing Project Wav2vec2
Apache-2.0
このモデルはwav2vec2-large-xls-r-300m-Urduをファインチューニングした音声処理モデルで、主にウルドゥー語音声認識タスクに使用されます。
音声認識 Transformers
V
Raffay
23
0
Speech Processing Project Wav2vec2
Apache-2.0
このモデルはkingabzpro/wav2vec2-urduをファインチューニングした音声処理モデルで、特定の音声認識タスクに適しています。
音声認識 Transformers
S
Raffay
21
0
Wav2vec2 Large Xls R 300m Urdu Cv8 200epochs
Common Voiceデータセットでトレーニングされたウルドゥー語音声認識モデル、wav2vec 2.0アーキテクチャ採用
音声認識 Transformers
W
omar47
20
0
Wav2vec2 Large Xls R 300m Ur
Apache-2.0
wav2vec2-large-xls-r-300mアーキテクチャに基づくウルドゥー語音声認識モデル、common_voiceデータセットでファインチューニング済み
音声認識 Transformers
W
anuragshas
20
0
Wav2vec2 Large Xls R 300m Urdu
Apache-2.0
facebook/wav2vec2-xls-r-300mをCommon Voice 8ウルドゥー語データセットでファインチューニングした音声認識モデル
音声認識 Transformers その他
W
kingabzpro
91.36k
13
Wav2vec2 Urdu
Apache-2.0
wav2vec2アーキテクチャに基づくウルドゥー語自動音声認識モデル、Common Voiceデータセットでファインチューニング
音声認識 Transformers その他
W
kingabzpro
101
3
Wav2vec2 Large Xls R 300m Urdu
Apache-2.0
これはfacebook/wav2vec2 - xls - r - 300mをベースに、ウルドゥー語Common Voice 7データセットで微調整された自動音声認識モデルです。
音声認識 Transformers その他
W
infinitejoy
15
0
Wav2vec2 Urdu Stt
これはWav2Vec2アーキテクチャに基づくウルドゥー語音声認識モデルで、ウルドゥー語音声をテキストに変換できます。
音声認識 Transformers
W
addy88
145
0
Wav2vec2 Xls R 300m Urdu
Facebookの3億パラメータの音声認識モデルで、ウルドゥー語に合わせて微調整され、汎用音声8.0ウルドゥー語データセットを基に訓練されています。
音声認識 Transformers
W
aasem
16
1
Wav2vec2 Xls R Urdu
Apache-2.0
このモデルはFacebookのWav2Vec2-Large-XLSR-53をウルドゥー語Common Voiceデータセットでファインチューニングした自動音声認識(ASR)モデルです
音声認識 Transformers その他
W
Maniac
22
1
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase