Wav2vec2 Large Xlrs Korean V5
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在zeroth_korean數據集上微調的韓語自動語音識別模型,詞錯誤率為0.2433。
語音識別
Transformers

W
student-47
285
1
Wav2vec2 Large Xlsr 53 Icelandic Ep30 967h
專為冰島語自動語音識別任務微調的聲學模型,基於967小時冰島語數據訓練
語音識別
Transformers 其他

W
language-and-voice-lab
2,153
2
Stt Ru Fastconformer Hybrid Large Pc
這是一個用於俄語自動語音識別的FastConformer混合模型,結合了Transducer和CTC解碼器,參數規模約1.15億。
語音識別 其他
S
nvidia
6,513
10
Stt De Fastconformer Hybrid Large Pc
這是一個基於FastConformer架構的德語自動語音識別模型,採用轉換器和CTC混合訓練方式,參數規模約115M。
語音識別 德語
S
nvidia
1,017
4
Wav2vec2 Large Xlsr 53 Spanish Ep5 944h
適用於西班牙語自動語音識別的聲學模型,基於facebook/wav2vec2-large-xlsr-53微調5個週期,使用約944小時西班牙語數據。
語音識別
Transformers 西班牙語

W
carlosdanielhernandezmena
111
3
Wav2vec2 Large Vi Vlsp2020
基於wav2vec2架構的越南語自動語音識別模型,預訓練使用1.3萬小時未標註YouTube音頻,並在250小時標註數據上微調
語音識別
Transformers 其他

W
nguyenvulebinh
385
4
Stt Ru Conformer Ctc Large
這是一個用於俄語自動語音識別的大型Conformer-CTC模型,在約1636小時的俄語語音數據上訓練,具有約1.2億參數。
語音識別 其他
S
nvidia
452
5
Stt Es Conformer Ctc Large
這是一個用於西班牙語自動語音識別(ASR)的大型Conformer-CTC模型,由NVIDIA訓練併發布。
語音識別 西班牙語
S
nvidia
59
2
Stt Fr Conformer Transducer Large
這是一個用於法語自動語音識別的大規模康福默-轉換器模型,參數約1.2億,在超過1500小時的法語語音數據上訓練而成。
語音識別 法語
S
nvidia
31
10
Wav2vec2 Large 960h Lv60 Self 4 Gram Fine Tune Real 29 Jun
Apache-2.0
該模型是基於facebook/wav2vec2-large-960h-lv60-self在uob_singlish數據集上微調的語音識別模型,支持新加坡英語識別。
語音識別
Transformers

W
RuiqianLi
105
0
Stt Fr Conformer Ctc Large
這是一個基於Conformer架構的法語自動語音識別(ASR)大模型,採用CTC損失函數,在超過1500小時的法語語音數據上訓練而成。
語音識別 法語
S
nvidia
361
6
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2數據集上微調的自動語音識別模型
語音識別
Transformers

A
gary109
40
0
Wav2vec2 Large Multilang Cv Ru
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在common_voice數據集上微調的版本,主要用於俄語語音識別任務。
語音識別
Transformers

W
cutten
16
0
Assignment1 Maria
MIT
s2t-small-librispeech-asr 是一個用於自動語音識別(ASR)的語音到文本轉換器(S2T)模型,基於序列到序列的轉換器架構。
語音識別
Transformers 英語

A
Classroom-workshop
23
0
Assignment1 Joane
MIT
一個用於自動語音識別(ASR)的語音到文本轉換器(S2T)模型
語音識別
Transformers 英語

A
Classroom-workshop
22
0
Assignment1 Jack
MIT
一個用於自動語音識別(ASR)的語音到文本轉換器(S2T)模型,基於序列到序列轉換器架構
語音識別
Transformers 英語

A
Classroom-workshop
24
0
Assignment1 Jane
MIT
s2t-small-librispeech-asr 是一個用於自動語音識別(ASR)的語音到文本轉換器(S2T)模型,基於序列到序列轉換器架構。
語音識別
Transformers 英語

A
Classroom-workshop
29
0
Assignment1 Omar
Apache-2.0
Wav2Vec2是一個基於自監督學習的語音識別模型,在LibriSpeech 960小時語音數據上預訓練和微調,支持英語語音轉錄。
語音識別
Transformers 英語

A
Classroom-workshop
28
0
Wav2vec2 Large Xls R 300m Singlish Colab
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在新加坡英語(li_singlish)數據集上微調的語音識別模型
語音識別
Transformers

W
RuiqianLi
22
1
Ai Light Dance Singing Ft Wav2vec2 Large Lv60 V2
Apache-2.0
該模型是基於wav2vec2-large-lv60在ONSET-SINGING數據集上微調的自動語音識別模型,專注於歌唱語音識別任務。
語音識別
Transformers

A
gary109
16
1
Dansk Wav2vec21
Apache-2.0
該模型是基於Siyam/SKYLy在common_voice數據集上微調得到的丹麥語語音識別模型
語音識別
Transformers

D
Siyam
32
0
English Filipino Wav2vec2 L Xls R Test 02
Apache-2.0
這是一個基於wav2vec2-large-xlsr-53-english模型在菲律賓語音數據集上微調的語音識別模型,支持英語和菲律賓語的語音轉文本任務。
語音識別
Transformers

E
Khalsuu
21
0
Wav2vec2 Common Voice Lithuanian
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在COMMON_VOICE - LT數據集上微調的版本,用於立陶宛語語音識別。
語音識別
Transformers 其他

W
birgermoell
17
0
20220413 210552
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的語音識別模型
語音識別
Transformers

2
lilitket
18
0
Aradia Ctc Distilhubert Ft
Apache-2.0
基於distilhubert在阿拉伯語語音數據集上微調的自動語音識別(ASR)模型
語音識別
Transformers

A
abdusah
16
0
Wav2vec2 Large Xls R 300m Irish Colab Test
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m模型在common_voice愛爾蘭語數據集上微調的語音識別模型,主要用於愛爾蘭語的自動語音識別任務。
語音識別
Transformers

W
jfealko
24
0
Wav2vec2 Xls R 1b English
Apache-2.0
這是一個基於XLS-R 1B架構的英語語音識別模型,在多個英語語音數據集上進行了微調。
語音識別
Transformers 英語

W
jonatasgrosman
1,896
9
S2t Large Librispeech Asr
MIT
一個用於自動語音識別(ASR)的端到端序列到序列轉換器模型,基於LibriSpeech數據集訓練
語音識別
Transformers 英語

S
facebook
422
10
Wav2vec2 Large Xls R 300m Ur
Apache-2.0
基於wav2vec2-large-xls-r-300m架構的烏爾都語語音識別模型,在common_voice數據集上微調
語音識別
Transformers

W
anuragshas
20
0
Wav2vec2 Xls R 1b Hi Cv8
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-1b模型在Common Voice 8.0印地語數據集上微調的自動語音識別模型,支持印地語語音轉文本任務。
語音識別
Transformers 其他

W
anuragshas
16
0
Wav2vec2 Xls R 1b Italian
Apache-2.0
這是一個基於XLS-R 1B架構的意大利語自動語音識別模型,在多個意大利語數據集上進行了微調
語音識別
Transformers 其他

W
jonatasgrosman
2,703
1
Wav2vec2 Speechdat
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在COMMON_VOICE - SV-SE數據集上微調的瑞典語自動語音識別模型。
語音識別
Transformers

W
birgermoell
29
0
Wav2vec2 Large Xls R 300m Irish
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在愛爾蘭語數據集上微調的自動語音識別(ASR)模型
語音識別
Transformers

W
infinitejoy
16
0
Wav2vec2 Large Xls R 300m Hindi Colab
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的版本,用於印地語語音識別任務。
語音識別
Transformers

W
chaitanya97
19
0
Wav2vec2 Xlsr Czech
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-1b在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - cs數據集上微調得到的捷克語自動語音識別模型。
語音識別
Transformers 其他

W
sammy786
21
0
Wav2vec2 Large Xlsr 53 Ir
Apache-2.0
基於wav2vec2-large-xlsr-53微調的愛爾蘭蓋爾語自動語音識別模型,在Common Voice 7.0數據集上訓練
語音識別
Transformers

W
jcmc
24
0
Wav2vec2 Xls R 1b Portuguese
Apache-2.0
這是一個基於XLS-R 1B架構的葡萄牙語自動語音識別模型,在多個葡萄牙語語音數據集上進行了微調。
語音識別
Transformers 其他

W
jonatasgrosman
648.50k
12
Wav2vec2 Large Xls R 300m Irish Colab
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的愛爾蘭語語音識別模型
語音識別
Transformers

W
jimregan
15
0
Wav2vec2 Xlsr Basaa
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-1b在Common Voice 8巴薩語數據集上微調得到的自動語音識別模型。
語音識別
Transformers 其他

W
sammy786
20
0
Wav2vec2 Xl 960h Dementiabank
Apache-2.0
該模型是基於facebook/wav2vec2-large-960h在DementiaBank數據集上微調的語音識別模型,主要用於語音轉文本任務。
語音識別
Transformers

W
shields
20
0
- 1
- 2
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98