# WER優化

Lite Whisper Large V3 Turbo
Apache-2.0
Lite-Whisper 是採用 LiteASR 技術壓縮的 OpenAI Whisper 輕量版,在保持較高準確率的同時顯著減小模型大小。
語音識別 Transformers
L
efficient-speech
516
8
Whisper Small El
Apache-2.0
這是一個基於openai/whisper-small模型在希臘語語音識別任務上微調的自動語音識別(ASR)模型,使用Mozilla Common Voice 17.0數據集中的3620個希臘語樣本進行訓練。
語音識別 Transformers 其他
W
mozilla-ai
94
1
XLSR WithLM Malayalam
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在IMaSC、Indic TTS Malayalam和OpenSLR Malayalam訓練集數據集上微調得到的版本,支持馬拉雅拉姆語自動語音識別。
語音識別 Transformers
X
kavyamanohar
19
4
Whisper Small Sk Cv11
Apache-2.0
基於OpenAI Whisper-small微調的斯洛伐克語語音識別模型,在Common Voice 11.0斯洛伐克語數據集上訓練
語音識別 Transformers 其他
W
mikr
79
2
Wav2vec2 2
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在評估集上詞錯誤率(WER)為0.8133
語音識別 Transformers
W
chrisvinsen
16
0
Wav2vec2 Base Demo Colab
Apache-2.0
基於facebook/wav2vec2-base模型微調的語音識別模型,在評估集上取得了31.42%的詞錯誤率
語音識別 Transformers
W
brever
16
0
English Filipino Wav2vec2 L Xls R Test 04
Apache-2.0
該模型是基於jonatasgrosman/wav2vec2-large-xlsr-53-english在filipino_voice數據集上微調的版本,用於英語-菲律賓語語音識別任務。
語音識別 Transformers
E
Khalsuu
21
0
English Filipino Wav2vec2 L Xls R Test
Apache-2.0
基於jonatasgrosman/wav2vec2-large-xlsr-53-english微調的英語-菲律賓語語音識別模型
語音識別 Transformers
E
Khalsuu
18
0
Wav2vec2 Base Timit Demo
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在TIMIT數據集上取得28.25%的詞錯誤率
語音識別 Transformers
W
dlu66061
21
0
Wav2vec2 Child En Tokenizer 4
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m微調的版本,專注於英語兒童語音識別任務。
語音識別 Transformers
W
jaeyeon
16
1
Wav2vec2 Base Toy Train Data Random Low Pass
Apache-2.0
該模型是基於facebook/wav2vec2-base在未知數據集上微調的語音識別模型,主要用於自動語音識別(ASR)任務。
語音識別 Transformers
W
scasutt
29
0
Wav2vec2 Large Xlsr 53 Toy Train Data Masked Audio 10ms
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53微調的語音識別模型,在10ms音頻掩碼訓練數據上優化
語音識別 Transformers
W
scasutt
22
0
Wav2vec2 Base Toy Train Data Random Noise 0.1
Apache-2.0
基於facebook/wav2vec2-base模型在隨機噪聲數據集上微調的語音識別模型
語音識別 Transformers
W
scasutt
22
0
Wav2vec2 Base Demo Colab
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在特定數據集上訓練,詞錯誤率(WER)為0.3391。
語音識別 Transformers
W
asakawa
24
0
Xls R Kyrgiz Cv8
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在Common Voice 8.0吉爾吉斯語數據集上微調的自動語音識別模型
語音識別 Transformers 其他
X
lucio
16
0
Wav2vec2 Base Demo Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base進行微調的語音識別模型,在Colab環境下訓練完成
語音識別 Transformers
W
thyagosme
20
0
Wav2vec2 Random
基於TIMIT_ASR數據集對wav2vec2-base-random模型進行微調的自動語音識別模型
語音識別 Transformers
W
patrickvonplaten
16
0
Wav2vec2 Xls R 300m Wolof Lm
MIT
這是一個基於facebook/wav2vec2-xls-r-300m微調的沃洛夫語自動語音識別模型,旨在解決沃洛夫語資源匱乏的問題。
語音識別 Transformers 其他
W
abdouaziiz
41
4
Sew Tiny Portuguese Cv8
Apache-2.0
這是一個基於SEW-tiny架構的葡萄牙語自動語音識別模型,在Common Voice 8數據集上微調,適用於葡萄牙語語音識別任務。
語音識別 Transformers 其他
S
lgris
16
0
Wav2vec2 Xls R 300m Italian Robust
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在多個意大利語語音數據集上微調的自動語音識別模型
語音識別 Transformers 其他
W
dbdmg
28
0
Wav2vec2 Georgian Daytona
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的格魯吉亞語語音識別模型,在通用語音數據集上訓練
語音識別 其他
W
Temur
19
2
Wav2vec2 Base Timit Demo Colab 32 Epochs30
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在TIMIT數據集上訓練30輪次
語音識別 Transformers
W
ying-tina
22
0
Wav2vec2 Large Xlsr 53 Hsb
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的上索布語語音識別模型,支持16kHz音頻輸入
語音識別 其他
W
anuragshas
23
0
Wav2vec2 Xls R 300m Gn Cv8
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m模型在Common Voice 8數據集上微調的自動語音識別(ASR)模型,支持瓜拉尼語(gn)。
語音識別 Transformers 其他
W
lgris
16
0
Wav2vec2 Large Xlsr Turkish Demo Colab
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在通用語音數據集上微調的土耳其語語音識別模型
語音識別 Transformers
W
patrickvonplaten
14
2
Wav2vec2 Xls R 300m Gl CV8
Apache-2.0
該模型是基於Facebook的wav2vec2-xls-r-300m在Common Voice加利西亞語(gl)數據集上微調的語音識別模型,在測試集上取得了20.8%的詞錯誤率(WER)。
語音識別 Transformers 其他
W
emre
18
0
Xls R Ab Test
該模型是在Common Voice 7.0 AB數據集上微調的自動語音識別模型,基於XLS-R dummy架構
語音識別 Transformers 其他
X
cahya
20
0
Wav2vec2 Xlsr Breton
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-1b在布列塔尼語數據集上微調的自動語音識別模型。
語音識別 Transformers 其他
W
sammy786
13
0
Wav2vec2 Large Xls R 300m Br D10
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m在布列塔尼語數據集上微調的語音識別模型,在Common Voice 8測試集上取得了52.3%的詞錯誤率(WER)。
語音識別 Transformers 其他
W
DrishtiSharma
21
0
Wav2vec2 Xls R 300m German De
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在MOZILLA-FOUNDATION/COMMON_VOICE_7_0 - DE數據集上微調的德語自動語音識別模型。
語音識別 Transformers 德語
W
AndrewMcDowell
72
3
Wav2vec2 Large Xls R 300m Hsb V1
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m在上索布語(HSB)數據集上微調的自動語音識別模型,在Common Voice 8測試集上取得了0.4393的詞錯誤率(WER)。
語音識別 Transformers 其他
W
DrishtiSharma
20
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase