# 低資源語音處理

Whisper Small Ta
Apache-2.0
該模型是基於OpenAI的Whisper Small在泰米爾語Common Voice 17.0數據集上微調的語音識別模型,詞錯誤率(WER)為43.23%。
語音識別 Transformers 其他
W
navin-kumar-j
38
1
Whisper Fa Tinyyy
MIT
基於OpenAI Whisper-tiny微調的波斯語自動語音識別模型,在common_voice_11_0數據集上訓練
語音識別 Transformers 其他
W
hackergeek98
55
2
Mms 300m Arabic Dialect Identifier
該模型是基於MMS-300m微調的阿拉伯語方言語音識別模型,能夠識別現代標準阿拉伯語及四種主要阿拉伯方言。
音頻分類 Transformers 阿拉伯語
M
badrex
73
2
Xls R Greek Cretan
首個針對克里特方言的自動語音識別(ASR)模型,基於希臘語XLS-R模型微調訓練。
語音識別 Transformers
X
ilsp
17
1
Arabic Alphabet Speech Classification
這是一個用於阿拉伯字母語音分類的transformers模型,能夠識別和分類阿拉伯語字母的發音。
音頻分類 Transformers
A
HamzaSidhu786
60
1
Whisper Large V3 Taiwanese Hakka
基於Whisper-large-v3微調的臺灣客家話語音識別模型,支持多種客家話方言
語音識別 Transformers 其他
W
formospeech
41
5
Wav2vec2 Large Xls R 300m Albanian Colab
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice_albanian數據集上微調的語音處理模型,適用於阿爾巴尼亞語相關任務。
語音識別 Transformers
W
Alimzhan
8,810
1
Viet Tones Model
基於wav2vec2-base-vietnamese-250h微調的越南語聲調識別模型,準確率59.72%
語音識別 Transformers
V
StevenLe456
22
0
Vegam Whisper Medium Ml
MIT
這是將thennal/whisper-medium-ml轉換為CTranslate2模型格式的版本,用於馬拉雅拉姆語語音識別
語音識別 其他
V
smcproject
83
5
Exp W2v2t Th Hubert S533
Apache-2.0
基於facebook/hubert-large-ll60k微調的泰語語音識別模型,訓練數據來自Common Voice 7.0
語音識別 Transformers 其他
E
jonatasgrosman
19
0
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V3
Apache-2.0
基於wav2vec2-large-xlsr-53的自動語音識別模型,在GARY109/AI_LIGHT_DANCE數據集上微調
語音識別 Transformers
A
gary109
191
0
Asr Wav2vec2 Dvoice Amharic
Apache-2.0
這是一個針對阿姆哈拉語的自動語音識別模型,使用wav2vec 2.0架構和CTC/Attention機制訓練
語音識別 其他
A
speechbrain
96
9
Wav2vec2 Xls R 300m Mrbrown Finetune1
Apache-2.0
基於facebook/wav2vec2-xls-r-300m預訓練模型,使用uob_singlish數據集進行微調的語音識別模型
語音識別 Transformers
W
RuiqianLi
18
0
Malaya Speech Mrbrown Finetune1
該模型是基於uob_singlish數據集對wav2vec2-xls-r-300m-mixed進行微調的版本,專注於新加坡英語語音識別。
語音識別 Transformers
M
RuiqianLi
24
0
One Simple Finetune Test
Apache-2.0
該模型是基於li_singlish數據集對RuiqianLi/wav2vec2-large-xls-r-300m-singlish-colab進行微調的版本,主要用於新加坡英語語音識別任務。
語音識別 Transformers
O
RuiqianLi
28
0
FYP ARABIZI
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在未知數據集上微調得到的語音識別模型,支持阿拉伯語方言(Arabizi)的識別。
語音識別 Transformers
F
ali-issa
33
1
Speech Processing Project Wav2vec2
Apache-2.0
該模型是基於kingabzpro/wav2vec2-urdu微調的語音處理模型,適用於特定語音識別任務。
語音識別 Transformers
S
Raffay
21
0
Filipino Wav2vec2 L Xls R 300m Test
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在filipino_voice數據集上微調的語音識別模型,支持菲律賓語。
語音識別 Transformers
F
Khalsuu
5,738
0
Wav2vec2 Large 100h Lv60 Self
Apache-2.0
Wav2Vec2-Large-100h-Lv60是基於100小時Libri-Light和Librispeech語音數據預訓練和微調的大模型,採用自訓練目標訓練,適用於16kHz採樣率的語音識別任務。
語音識別 Transformers 英語
W
Splend1dchan
17
0
Wav2vec2 Common Voice Tr Demo
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在土耳其語Common Voice數據集上微調的語音識別模型
語音識別 Transformers 其他
W
YiTian
30
0
Distilhubert
Apache-2.0
DistilHuBERT是一種通過層級蒸餾HuBERT模型實現的輕量級語音表徵學習模型,在保持性能的同時顯著減小模型體積和計算成本。
語音識別 Transformers 英語
D
ntu-spml
2,962
31
Wav2vec2 Xls R 300m Lg
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在COMMON_VOICE - LG數據集上進行微調的語音識別模型,支持盧幹達語(lg)的自動語音識別任務。
語音識別 Transformers 其他
W
samitizerxu
22
0
W2v Timit Ft 4001
基於Wav2Vec 2.0架構的語音識別模型,在TIMIT數據集上微調,適用於英語語音轉文本任務
語音識別 Transformers
W
devin132
22
0
Unispeech 1350 En 168 Es Ft 1h
UniSpeech是一個統一語音表徵學習模型,結合標註與無標註數據進行預訓練,特別針對西班牙語音素識別進行了微調。
語音識別 Transformers 西班牙語
U
microsoft
19
0
Wav2vec2 Large Xlsr 53 Turkish
Apache-2.0
這是一個基於Facebook的wav2vec2-large-xlsr-53模型在土耳其語Common Voice數據集上微調的自動語音識別(ASR)模型。
語音識別 其他
W
ceyda
54
1
Sew D Small 100k Ft Timit
Apache-2.0
基於asapp/sew-d-small-100k在TIMIT_ASR數據集上微調的自動語音識別模型
語音識別 Transformers
S
patrickvonplaten
18
0
Wav2vec2 Large Xls R 300m My Hindi Home Colab
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在通用語音數據集上微調的版本,適用於語音識別任務。
語音識別 Transformers
W
nimrah
16
0
Wav2vec2 Large Xlsr 53 Ir
Apache-2.0
基於wav2vec2-large-xlsr-53微調的愛爾蘭蓋爾語自動語音識別模型,在Common Voice 7.0數據集上訓練
語音識別 Transformers
W
jcmc
24
0
Wav2vec2 Xls R 300m W2V2 XLSR 300M YAKUT SMALL
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m模型在雅庫特語(薩哈語)語音數據集上微調的語音識別模型
語音識別 Transformers 其他
W
emre
90
0
Wav2vec2 Large Xls Ar
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的阿拉伯語自動語音識別模型,在Common Voice阿拉伯語數據集上測試WER為52%。
語音識別 Transformers 阿拉伯語
W
mohamed1ai
30
1
Wav2vec2 Large 960h
Apache-2.0
Wav2Vec2是Facebook開發的語音識別模型,通過自監督學習從原始音頻中學習語音表示,並在LibriSpeech數據集上微調,實現高精度語音轉錄。
語音識別 Transformers 英語
W
facebook
77.59k
29
Wav2vec2 Base 10k Voxpopuli Ft Sk
基於VoxPopuli語料庫10K未標註數據預訓練,並在斯洛伐克語轉錄數據上微調的語音識別模型
語音識別 Transformers 其他
W
facebook
39
1
Wav2vec2 Large Xlsr Upper Sorbian Mixed
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53微調的上索布語語音識別模型,訓練數據來自通用語音數據集和在線索布語課程。
語音識別 其他
W
jimregan
25
0
Wav2vec2 XLS R 300m Konkani
基於 facebook/wav2vec2-xls-r-300m 在私有數據集上微調的自動語音識別模型,具備魯棒語音事件處理能力。
語音識別 Transformers
W
StephennFernandes
74
0
Wav2vec2 Large Xlsr Arabic Demo Colab
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型在通用語音數據集上微調的阿拉伯語語音識別模型
語音識別 Transformers
W
Wiam
22
0
Fb Youtube Vi Large
Apache-2.0
該模型是基於facebook/wav2vec2-large-xlsr-53在越南語YouTube非正式音頻數據集上微調的自動語音識別模型。
語音識別 Transformers
F
phongdtd
31
1
Wav2vec2 Large Xlsr 53 Arabic
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53微調的阿拉伯語自動語音識別模型,支持16kHz採樣率的語音輸入
語音識別 阿拉伯語
W
elgeish
994
16
Arabic Speech Recognition
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的阿拉伯語自動語音識別模型,支持16kHz採樣率語音輸入
語音識別 阿拉伯語
A
mohammed
37
2
Xlrs 53 Finnish
Apache-2.0
XLSR-Wav2Vec2是一個多語言語音識別模型,通過跨語言預訓練學習共享語音表徵,支持53種語言。
語音識別 其他
X
vneralla
32
0
Wav2vec2 Large Xlsr 53 Sw
Apache-2.0
基於XLSR-53大模型微調的斯瓦希里語自動語音識別模型,支持16kHz採樣率語音輸入
語音識別 其他
W
alokmatta
158
2
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase