# 高精度WER

Wav2vec2 Large Xlrs Korean V5
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在zeroth_korean數據集上微調的韓語自動語音識別模型,詞錯誤率為0.2433。
語音識別 Transformers
W
student-47
285
1
Wav2vec2 Large Xlsr 53 Icelandic Ep30 967h
專為冰島語自動語音識別任務微調的聲學模型,基於967小時冰島語數據訓練
語音識別 Transformers 其他
W
language-and-voice-lab
2,153
2
Stt Ru Fastconformer Hybrid Large Pc
這是一個用於俄語自動語音識別的FastConformer混合模型,結合了Transducer和CTC解碼器,參數規模約1.15億。
語音識別 其他
S
nvidia
6,513
10
Stt De Fastconformer Hybrid Large Pc
這是一個基於FastConformer架構的德語自動語音識別模型,採用轉換器和CTC混合訓練方式,參數規模約115M。
語音識別 德語
S
nvidia
1,017
4
Wav2vec2 Large Xlsr 53 Spanish Ep5 944h
適用於西班牙語自動語音識別的聲學模型,基於facebook/wav2vec2-large-xlsr-53微調5個週期,使用約944小時西班牙語數據。
語音識別 Transformers 西班牙語
W
carlosdanielhernandezmena
111
3
Wav2vec2 Large Vi Vlsp2020
基於wav2vec2架構的越南語自動語音識別模型,預訓練使用1.3萬小時未標註YouTube音頻,並在250小時標註數據上微調
語音識別 Transformers 其他
W
nguyenvulebinh
385
4
Stt Ru Conformer Ctc Large
這是一個用於俄語自動語音識別的大型Conformer-CTC模型,在約1636小時的俄語語音數據上訓練,具有約1.2億參數。
語音識別 其他
S
nvidia
452
5
Stt Es Conformer Ctc Large
這是一個用於西班牙語自動語音識別(ASR)的大型Conformer-CTC模型,由NVIDIA訓練併發布。
語音識別 西班牙語
S
nvidia
59
2
Stt Fr Conformer Transducer Large
這是一個用於法語自動語音識別的大規模康福默-轉換器模型,參數約1.2億,在超過1500小時的法語語音數據上訓練而成。
語音識別 法語
S
nvidia
31
10
Wav2vec2 Large 960h Lv60 Self 4 Gram Fine Tune Real 29 Jun
Apache-2.0
該模型是基於facebook/wav2vec2-large-960h-lv60-self在uob_singlish數據集上微調的語音識別模型,支持新加坡英語識別。
語音識別 Transformers
W
RuiqianLi
105
0
Stt Fr Conformer Ctc Large
這是一個基於Conformer架構的法語自動語音識別(ASR)大模型,採用CTC損失函數,在超過1500小時的法語語音數據上訓練而成。
語音識別 法語
S
nvidia
361
6
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2數據集上微調的自動語音識別模型
語音識別 Transformers
A
gary109
40
0
Wav2vec2 Large Multilang Cv Ru
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在common_voice數據集上微調的版本,主要用於俄語語音識別任務。
語音識別 Transformers
W
cutten
16
0
Assignment1 Maria
MIT
s2t-small-librispeech-asr 是一個用於自動語音識別(ASR)的語音到文本轉換器(S2T)模型,基於序列到序列的轉換器架構。
語音識別 Transformers 英語
A
Classroom-workshop
23
0
Assignment1 Joane
MIT
一個用於自動語音識別(ASR)的語音到文本轉換器(S2T)模型
語音識別 Transformers 英語
A
Classroom-workshop
22
0
Assignment1 Jack
MIT
一個用於自動語音識別(ASR)的語音到文本轉換器(S2T)模型,基於序列到序列轉換器架構
語音識別 Transformers 英語
A
Classroom-workshop
24
0
Assignment1 Jane
MIT
s2t-small-librispeech-asr 是一個用於自動語音識別(ASR)的語音到文本轉換器(S2T)模型,基於序列到序列轉換器架構。
語音識別 Transformers 英語
A
Classroom-workshop
29
0
Assignment1 Omar
Apache-2.0
Wav2Vec2是一個基於自監督學習的語音識別模型,在LibriSpeech 960小時語音數據上預訓練和微調,支持英語語音轉錄。
語音識別 Transformers 英語
A
Classroom-workshop
28
0
Wav2vec2 Large Xls R 300m Singlish Colab
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在新加坡英語(li_singlish)數據集上微調的語音識別模型
語音識別 Transformers
W
RuiqianLi
22
1
Ai Light Dance Singing Ft Wav2vec2 Large Lv60 V2
Apache-2.0
該模型是基於wav2vec2-large-lv60在ONSET-SINGING數據集上微調的自動語音識別模型,專注於歌唱語音識別任務。
語音識別 Transformers
A
gary109
16
1
Dansk Wav2vec21
Apache-2.0
該模型是基於Siyam/SKYLy在common_voice數據集上微調得到的丹麥語語音識別模型
語音識別 Transformers
D
Siyam
32
0
English Filipino Wav2vec2 L Xls R Test 02
Apache-2.0
這是一個基於wav2vec2-large-xlsr-53-english模型在菲律賓語音數據集上微調的語音識別模型,支持英語和菲律賓語的語音轉文本任務。
語音識別 Transformers
E
Khalsuu
21
0
Wav2vec2 Common Voice Lithuanian
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在COMMON_VOICE - LT數據集上微調的版本,用於立陶宛語語音識別。
語音識別 Transformers 其他
W
birgermoell
17
0
20220413 210552
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的語音識別模型
語音識別 Transformers
2
lilitket
18
0
Aradia Ctc Distilhubert Ft
Apache-2.0
基於distilhubert在阿拉伯語語音數據集上微調的自動語音識別(ASR)模型
語音識別 Transformers
A
abdusah
16
0
Wav2vec2 Large Xls R 300m Irish Colab Test
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m模型在common_voice愛爾蘭語數據集上微調的語音識別模型,主要用於愛爾蘭語的自動語音識別任務。
語音識別 Transformers
W
jfealko
24
0
Wav2vec2 Xls R 1b English
Apache-2.0
這是一個基於XLS-R 1B架構的英語語音識別模型,在多個英語語音數據集上進行了微調。
語音識別 Transformers 英語
W
jonatasgrosman
1,896
9
S2t Large Librispeech Asr
MIT
一個用於自動語音識別(ASR)的端到端序列到序列轉換器模型,基於LibriSpeech數據集訓練
語音識別 Transformers 英語
S
facebook
422
10
Wav2vec2 Large Xls R 300m Ur
Apache-2.0
基於wav2vec2-large-xls-r-300m架構的烏爾都語語音識別模型,在common_voice數據集上微調
語音識別 Transformers
W
anuragshas
20
0
Wav2vec2 Xls R 1b Hi Cv8
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-1b模型在Common Voice 8.0印地語數據集上微調的自動語音識別模型,支持印地語語音轉文本任務。
語音識別 Transformers 其他
W
anuragshas
16
0
Wav2vec2 Xls R 1b Italian
Apache-2.0
這是一個基於XLS-R 1B架構的意大利語自動語音識別模型,在多個意大利語數據集上進行了微調
語音識別 Transformers 其他
W
jonatasgrosman
2,703
1
Wav2vec2 Speechdat
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在COMMON_VOICE - SV-SE數據集上微調的瑞典語自動語音識別模型。
語音識別 Transformers
W
birgermoell
29
0
Wav2vec2 Large Xls R 300m Irish
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在愛爾蘭語數據集上微調的自動語音識別(ASR)模型
語音識別 Transformers
W
infinitejoy
16
0
Wav2vec2 Large Xls R 300m Hindi Colab
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的版本,用於印地語語音識別任務。
語音識別 Transformers
W
chaitanya97
19
0
Wav2vec2 Xlsr Czech
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-1b在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - cs數據集上微調得到的捷克語自動語音識別模型。
語音識別 Transformers 其他
W
sammy786
21
0
Wav2vec2 Large Xlsr 53 Ir
Apache-2.0
基於wav2vec2-large-xlsr-53微調的愛爾蘭蓋爾語自動語音識別模型,在Common Voice 7.0數據集上訓練
語音識別 Transformers
W
jcmc
24
0
Wav2vec2 Xls R 1b Portuguese
Apache-2.0
這是一個基於XLS-R 1B架構的葡萄牙語自動語音識別模型,在多個葡萄牙語語音數據集上進行了微調。
語音識別 Transformers 其他
W
jonatasgrosman
648.50k
12
Wav2vec2 Large Xls R 300m Irish Colab
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的愛爾蘭語語音識別模型
語音識別 Transformers
W
jimregan
15
0
Wav2vec2 Xlsr Basaa
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-1b在Common Voice 8巴薩語數據集上微調得到的自動語音識別模型。
語音識別 Transformers 其他
W
sammy786
20
0
Wav2vec2 Xl 960h Dementiabank
Apache-2.0
該模型是基於facebook/wav2vec2-large-960h在DementiaBank數據集上微調的語音識別模型,主要用於語音轉文本任務。
語音識別 Transformers
W
shields
20
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase