# 高精度語音轉寫

Whisper Medium Oswald
Apache-2.0
基於OpenAI Whisper-medium微調的海地克里奧爾語語音識別模型,專注高準確率轉錄
語音識別 Transformers 其他
W
jsbeaudry
102
1
Exp W2v2t It Wavlm S895
Apache-2.0
基於microsoft/wavlm-large模型微調的意大利語自動語音識別模型,使用Common Voice 7.0意大利語數據集訓練。
語音識別 Transformers 其他
E
jonatasgrosman
42
0
Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 5gram V3
基於wav2vec2-large-xlsr-53模型微調的自動語音識別模型,專注於歌唱語音識別
語音識別 Transformers
A
gary109
97
0
Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 5gram V4 1
該模型是基於wav2vec2-large-xlsr-53架構的自動語音識別(ASR)模型,在GARY109/AI_LIGHT_DANCE - ONSET-SINGING2數據集上微調得到,主要用於歌唱語音識別任務。
語音識別 Transformers
A
gary109
66
1
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V5
Apache-2.0
基於wav2vec2-large-xlsr-53的自動語音識別模型,在GARY109/AI_LIGHT_DANCE數據集上微調
語音識別 Transformers
A
gary109
160
0
Wav2vec2 Large Xls R 300m Turkish Colab
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice土耳其語數據集上微調的語音識別模型,在評估集上取得了32.08%的詞錯誤率。
語音識別 Transformers
W
Samiul
99
0
Ai Light Dance Singing Ft Pretrain Wav2vec2 Large Lv60
該模型是基於wav2vec2-large-lv60架構的自動語音識別(ASR)模型,在GARY109/AI_LIGHT_DANCE - ONSET-SINGING數據集上微調得到,主要用於歌聲識別任務。
語音識別 Transformers
A
gary109
22
0
Wav2vec2 Final 1 Lm 4
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在評估集上詞錯誤率為0.4499
語音識別 Transformers
W
chrisvinsen
16
0
Wav2vec2 Large Xlsr 53 Tr Fine Tuning Deprecated
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在common_voice土耳其語數據集上微調的語音識別模型
語音識別 Transformers
W
bekirbakar
17
0
Wav2vec2 1b Npsc Nst Bokmaal
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-1b在挪威語Bokmål方言語音數據集上微調的自動語音識別(ASR)模型
語音識別 Transformers
W
NbAiLab
30
0
Aspram
Apache-2.0
基於wav2vec2-xls-r-2b架構的亞美尼亞語自動語音識別模型,支持hy/hye語言
語音識別 Transformers 其他
A
YSU
170
4
20220412 203254
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的語音識別模型,支持自動語音識別任務。
語音識別 Transformers
2
lilitket
18
0
Wav2vec2 Large 100h Lv60 Self
Apache-2.0
Wav2Vec2-Large-100h-Lv60是基於100小時Libri-Light和Librispeech語音數據預訓練和微調的大模型,採用自訓練目標訓練,適用於16kHz採樣率的語音識別任務。
語音識別 Transformers 英語
W
Splend1dchan
17
0
Wav2vec2 Large Xlsr 53 Ft Cgn
基於facebook/wav2vec2-large-xlsr-53大模型,通過CTC損失函數在荷蘭語口語語料庫上進行微調訓練的荷蘭語語音識別模型
語音識別 Transformers 其他
W
GroNLP
22
3
Wav2vec2 Dutch Large Ft Cgn
一款荷蘭語Wav2Vec2模型,通過在荷蘭語音庫CGN上對原始英文模型進行持續預訓練和微調構建。
語音識別 Transformers 其他
W
GroNLP
18
1
Wav2vec2 Large Xls R 300m Vietnamese Colab
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在通用語音數據集上微調的越南語語音識別模型
語音識別 Transformers
W
Jungwonchang
22
0
Wav2vec2 2 Bart Large No Adapter
該模型是基於LibriSpeech ASR數據集訓練的自動語音識別(ASR)模型,能夠將英語語音轉換為文本。
語音識別 Transformers
W
sanchit-gandhi
22
0
Wav2vec2 Large It Voxpopuli
基於VoxPopuli意大利語無標註數據預訓練的語音識別模型,採用Facebook的Wav2Vec2架構
語音識別 其他
W
facebook
55
0
Wav2vec2 Xls R 300m Turkish Tr Med
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在常見語音數據集上微調的土耳其語語音識別模型
語音識別 Transformers
W
emre
22
0
Wav2vec2 Large Xlsr Persian V2
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在波斯語(波斯語)上使用Common Voice數據集進行微調的自動語音識別模型
語音識別 其他
W
m3hrdadfi
47
6
Wav2vec2 2 Bert Large No Adapter Frozen Enc
該模型是基於librispeech_asr數據集訓練的語音識別模型,在評估集上取得了2.0133的詞錯誤率(WER)。
語音識別 Transformers
W
speech-seq2seq
25
2
Wav2vec2 Common Voice Tr Demo
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53模型在COMMON_VOICE - TR土耳其語數據集上微調的自動語音識別(ASR)模型。
語音識別 Transformers 其他
W
shiyue
25
0
English Model
基於facebook/wav2vec2-large模型,使用Common Voice數據集進行英語微調的語音識別模型,支持16kHz採樣率的語音輸入。
語音識別 Transformers
E
tanmayplanet32
30
0
Wav2vec2 Large Xlsr Persian Shemo
Apache-2.0
基於Wav2Vec2-Large-XLSR-53在波斯語ShEMO數據集上微調的自動語音識別模型
語音識別 其他
W
m3hrdadfi
28
3
Wav2vec2 2 Bert Large No Adapter
基於LibriSpeech數據集訓練的自動語音識別(ASR)模型,用於將英語語音轉換為文本
語音識別 Transformers
W
speech-seq2seq
15
1
Wav2vec2 Xlsr Tatar
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-1b在韃靼語數據集上微調得到的自動語音識別模型,在Common Voice 8數據集上取得了16.87%的詞錯誤率(WER)。
語音識別 Transformers 其他
W
sammy786
17
1
Wav2vec2 Large Xlsr 53 Esperanto
Apache-2.0
這是一個基於Facebook的wav2vec2-large-xlsr-53模型微調的世界語(Esperanto)語音識別模型,使用Common Voice數據集訓練。
語音識別 其他
W
cpierse
8,681
6
Wav2vec2 Xlsr Chuvash
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-1b在Common Voice 8楚瓦什語數據集上微調的自動語音識別模型
語音識別 Transformers 其他
W
sammy786
23
0
Wav2vec2 Large Xls R 300m Turkish Colab
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的土耳其語語音識別模型。
語音識別 Transformers
W
masapasa
20
0
Wav2vec2 Large Xlsr 53 Levantine Arabic
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型,在阿拉伯語音語料庫數據集上微調的阿拉伯語語音識別模型
語音識別 阿拉伯語
W
elgeish
46
4
Kabyle Xlsr
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m模型在卡拜爾語數據集上微調的自動語音識別(ASR)模型
語音識別 Transformers 其他
K
Akashpb13
39
2
Wav2vec2 Large Xlsr 53 French
Apache-2.0
這是一個基於wav2vec2架構的自動語音識別(ASR)模型,專門針對法語進行了微調,在Common Voice法語測試集上取得了12.82%的詞錯誤率(WER)。
語音識別 Transformers 法語
W
Ilyes
31
4
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase