Wav2vec2 Large Xlsr Deepfake Audio Classification
Apache-2.0
基於wav2vec2架構的音頻分類模型,針對深度偽造音頻檢測任務進行微調,在性別識別和偽造音頻檢測方面表現優異。
音頻分類
Transformers

W
Gustking
345
3
Wav2vec2 Large Xlsr 53 Amharic
MIT
該模型是在facebook/wav2vec2-large-xlsr-53基礎上,使用阿姆哈拉語語音語料庫進行微調的自動語音識別(ASR)模型。
語音識別
Transformers 其他

W
agkphysics
2,539
4
Exp W2v2t It Xlsr 53 S387
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的意大利語自動語音識別模型,使用Common Voice 7.0意大利語數據集訓練。
語音識別
Transformers 其他

E
jonatasgrosman
18
0
Exp W2v2t Ja Xlsr 53 S109
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的日語自動語音識別模型,使用Common Voice 7.0日語數據集訓練
語音識別
Transformers 日語

E
jonatasgrosman
20
0
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V7
Apache-2.0
基於wav2vec2-large-xlsr-53的自動語音識別模型,專為StepMania遊戲音頻優化,在GARY109/AI_LIGHT_DANCE數據集上微調
語音識別
Transformers

A
gary109
162
0
Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 5gram V4 2
基於wav2vec2-large-xlsr-53模型微調的自動語音識別模型,在GARY109/AI_LIGHT_DANCE數據集上訓練
語音識別
Transformers

A
gary109
68
1
Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 5gram V3
基於wav2vec2-large-xlsr-53模型微調的自動語音識別模型,專注於歌唱語音識別
語音識別
Transformers

A
gary109
97
0
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V6
Apache-2.0
該模型是基於wav2vec2-large-xlsr-53在GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2數據集上微調的自動語音識別模型。
語音識別
Transformers

A
gary109
160
0
Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 5gram V4 1
該模型是基於wav2vec2-large-xlsr-53架構的自動語音識別(ASR)模型,在GARY109/AI_LIGHT_DANCE - ONSET-SINGING2數據集上微調得到,主要用於歌唱語音識別任務。
語音識別
Transformers

A
gary109
66
1
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V3
Apache-2.0
基於wav2vec2-large-xlsr-53的自動語音識別模型,在GARY109/AI_LIGHT_DANCE數據集上微調
語音識別
Transformers

A
gary109
191
0
Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 V1
Apache-2.0
該模型是基於wav2vec2-large-xlsr-53在GARY109/AI_LIGHT_DANCE - ONSET-SINGING2數據集上微調的自動語音識別模型,主要用於歌唱語音識別任務。
語音識別
Transformers

A
gary109
185
0
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V2
Apache-2.0
該模型是基於wav2vec2-large-xlsr-53在GARY109/AI_LIGHT_DANCE數據集上微調的自動語音識別模型
語音識別
Transformers

A
gary109
166
0
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V1
Apache-2.0
該模型是基於wav2vec2-large-xlsr-53在GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2數據集上微調得到的自動語音識別模型。
語音識別
Transformers

A
gary109
48
0
Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在AI Light Dance數據集上微調的自動語音識別模型。
語音識別
Transformers

A
gary109
26
1
Ai Light Dance Chord Ft Wav2vec2 Large Xlsr 53
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在GARY109/AI_Light_Dance - ONSET-CHORD2數據集上微調的自動語音識別模型。
語音識別
Transformers

A
gary109
46
0
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2數據集上微調的自動語音識別模型
語音識別
Transformers

A
gary109
40
0
Ai Light Dance Singing Ft Wav2vec2 Large Xlsr 53 5gram V1
該模型是基於wav2vec2-large-xlsr-53的自動語音識別模型,在GARY109/AI_LIGHT_DANCE - ONSET-SINGING數據集上微調得到,主要用於歌唱語音識別。
語音識別
Transformers

A
gary109
18
1
Ai Light Dance Singing Ft Wav2vec2 Large Xlsr 53
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在AI_LIGHT_DANCE - ONSET-SINGING數據集上微調的自動語音識別模型,主要用於歌唱語音識別任務。
語音識別
Transformers

A
gary109
23
1
Wav2vec2 Large Multilang Cv Ru
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在common_voice數據集上微調的版本,主要用於俄語語音識別任務。
語音識別
Transformers

W
cutten
16
0
Wav2vec2 Large Xlsr 53 Tr Fine Tuning Deprecated
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在common_voice土耳其語數據集上微調的語音識別模型
語音識別
Transformers

W
bekirbakar
17
0
Wav2vec2 Large Xlsr 53 842h Luxembourgish 14h
MIT
基於842小時未標註和14小時標註盧森堡語語音數據微調的wav2vec2.0大模型,支持盧森堡語語音識別
語音識別
Transformers 其他

W
Lemswasabi
204
0
Wav2vec2 Common Voice Tr Demo Dist
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在COMMON_VOICE - TR土耳其語數據集上微調的自動語音識別(ASR)模型,在評估集上取得了0.3242的詞錯誤率。
語音識別
Transformers 其他

W
cromz22
26
0
FYP ARABIZI
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在未知數據集上微調得到的語音識別模型,支持阿拉伯語方言(Arabizi)的識別。
語音識別
Transformers

F
ali-issa
33
1
Bach Arb
基於jonatasgrosman/wav2vec2-large-xlsr-53-german微調的德語語音識別模型
語音識別
Transformers

B
bkh6722
30
0
Wav2vec2 Common Voice Lithuanian
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在COMMON_VOICE - LT數據集上微調的版本,用於立陶宛語語音識別。
語音識別
Transformers 其他

W
birgermoell
17
0
Ft Pt Br Local
Apache-2.0
基於jonatasgrosman/wav2vec2-large-xlsr-53-portuguese微調的葡萄牙語自動語音識別模型
語音識別
Transformers

F
tonyalves
31
1
Wav2vec2 Large Xlsr 53 Chinese Zh Cn
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的中文語音識別模型,支持16kHz採樣率的語音輸入。
語音識別 中文
W
jonatasgrosman
3.8M
110
Wav2vec2 Large Xlsr 53 Dutch
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53微調的荷蘭語語音識別模型,在Common Voice和CSS10數據集上訓練,支持16kHz音頻輸入。
語音識別 其他
W
jonatasgrosman
3.0M
12
Wav2vec2 Large Xlsr 53 Dutch
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在荷蘭語Common Voice數據集上微調的自動語音識別模型,測試WER為17.09%。
語音識別
Transformers 其他

W
wietsedv
44
1
Wav2vec2 Large Xlsr 53 W2V2 TATAR SMALL
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在Common Voice 8數據集上微調的韃靼語(Tatar)自動語音識別模型,測試集WER為53.16%。
語音識別
Transformers 其他

W
emre
30
1
Wav2vec2 Large Xlsr 53 Sakha
Apache-2.0
基於XLSR-53大模型微調的雅庫特語語音識別模型,詞錯誤率32.23%
語音識別 其他
W
anton-l
25
0
Wav2vec2 Large Xlsr 53 Finnish
Apache-2.0
基於XLSR-53大模型微調的芬蘭語語音識別模型,支持16kHz音頻輸入
語音識別 其他
W
jonatasgrosman
73.11k
1
Wav2vec2 Large Xlsr 53 German
Apache-2.0
這是一個針對德語語音識別任務微調的XLSR-53大模型,基於Facebook的wav2vec2-large-xlsr-53模型,在Common Voice 6.1德語數據集上進行了微調。
語音識別 德語
W
jonatasgrosman
8,266
7
Wav2vec2 Common Voice Tr Demo
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在COMMON_VOICE SV-SE數據集上微調的自動語音識別(ASR)模型,支持瑞典語語音識別。
語音識別
Transformers

W
birgermoell
17
0
Wav2vec2 Common Voice Tr Demo
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53模型在COMMON_VOICE - TR土耳其語數據集上微調的自動語音識別(ASR)模型。
語音識別
Transformers 其他

W
shiyue
25
0
Wav2vec2 Large Xlsr 53 French
Apache-2.0
這是一個基於XLSR-53大模型微調的法語語音識別模型,在Common Voice數據集上訓練,支持高準確率的法語語音轉文本。
語音識別 法語
W
jonatasgrosman
47.83k
11
Wav2vec2 Large Xlsr 53 Euskera
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型在巴斯克語(Euskera)上使用Common Voice數據集進行微調的語音識別模型。
語音識別 其他
W
mrm8488
28
0
Wav2vec2 Large Xlsr Gu
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的古吉拉特語自動語音識別模型,在OpenSLR數據集上達到23.55%的WER
語音識別 其他
W
gchhablani
3,582
0
Wav2vec2 Large Xlsr Kn
Apache-2.0
這是一個基於Facebook的wav2vec2-large-xlsr-53模型在卡納達語上進行微調的自動語音識別(ASR)模型,使用OpenSLR SLR79數據集訓練。
語音識別 其他
W
amoghsgopadi
2,200
1
Wav2vec2 Xlsr 53 Rm Vallader With Lm
Apache-2.0
基於wav2vec2-xlsr-53的羅曼什語瓦拉迪爾方言語音識別模型,帶有語言模型支持
語音識別
Transformers

W
anuragshas
16
0
- 1
- 2
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98