Whisper Kurmanji
Apache-2.0
針對庫爾德語庫爾曼吉方言的自動語音識別模型,基於Whisper架構微調
語音識別
Safetensors 其他
W
amedcj
272
1
Akan Whisper Model
基於OpenAI Whisper模型微調的版本,專為加納低資源語言阿坎語的自動語音識別任務設計
語音識別
Transformers 其他

A
GiftMark
354
3
Whisper Medium Aeb ENT
Apache-2.0
基於openai/whisper-medium在AT_ENT數據集上微調的阿拉伯語(突尼斯方言)語音識別模型
語音識別
Transformers 其他

W
Rziane
15
1
Whisper Medium Darija
Apache-2.0
基於openai/whisper-medium在達裡賈方言語音轉文本數據集上微調的語音識別模型
語音識別
Transformers 其他

W
ychafiqui
169
5
Indicconformer Stt Ur Hybrid Ctc Rnnt Large
MIT
IndicConformer 是一個基於混合 CTC-RNNT 架構的 Conformer 自動語音識別模型,專門用於烏爾都語語音轉錄。
語音識別 其他
I
ai4bharat
44
2
Indicconformer Stt As Hybrid Ctc Rnnt Large
MIT
IndicConformer 是一個基於混合 CTC-RNNT 架構的 Conformer 自動語音識別(ASR)模型,支持阿薩姆語語音轉錄。
語音識別 其他
I
ai4bharat
101
3
Wav2vec2 Large Xls R 300m Amharic Demo Colab
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在common_voice_16_1數據集上微調的阿姆哈拉語語音識別模型
語音識別
Transformers

W
DipsankarSinha
18
2
Akylai STT Small
Apache-2.0
吉爾吉斯語Whisper ASR是一款專為吉爾吉斯語定製的自動語音識別解決方案,基於預訓練的Whisper模型微調適配。
語音識別
Transformers 其他

A
the-cramer-project
73
1
Whisper Large Sme
Apache-2.0
基於Whisper-large-v2微調的北薩米語語音識別模型,在測試集上詞錯誤率為24.91%
語音識別
Transformers 其他

W
NbAiLab
40
5
Whisper Small Pashto
Apache-2.0
基於OpenAI Whisper-small微調的普什圖語(ps)語音識別模型,在FLEURS數據集上訓練
語音識別
Transformers 其他

W
ihanif
18
1
Asr Wav2vec2 Dvoice Darija
Apache-2.0
這是一個針對摩洛哥阿拉伯語方言(Darija)的自動語音識別模型,基於wav2vec 2.0架構在DVoice數據集上微調訓練而成。
語音識別 其他
A
speechbrain
120
11
My Final Wav2vec2 Urdu Asr Project
這是一個基於wav2vec2架構的烏爾都語自動語音識別(ASR)模型,從頭開始訓練。
語音識別
Transformers

M
Raffay
24
0
Wav2vec2 Large Xls R 300m Ha Cv8
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在通用語音數據集上微調的豪薩語語音識別模型
語音識別
Transformers 其他

W
anuragshas
17
1
Wav2vec2 Large Xls R 300m Kyrgyz
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m模型在吉爾吉斯語語音數據集上微調的自動語音識別(ASR)模型
語音識別
Transformers 其他

W
infinitejoy
17
0
Wav2vec2 Xls R 300m Wolof Lm
MIT
這是一個基於facebook/wav2vec2-xls-r-300m微調的沃洛夫語自動語音識別模型,旨在解決沃洛夫語資源匱乏的問題。
語音識別
Transformers 其他

W
abdouaziiz
41
4
Wav2vec2 Large Xlsr 53 Telugu
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的泰盧固語語音識別模型,使用OpenSLR SLR66數據集訓練
語音識別 其他
W
anuragshas
44.24k
5
Wav2vec2 Large Xlsr Cnh
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的哈卡欽語語音識別模型,在通用語音數據集上訓練,測試WER為31.38%。
語音識別 其他
W
gchhablani
22
0
Wav2vec2 Large Xlsr Kn
Apache-2.0
這是一個基於Facebook的wav2vec2-large-xlsr-53模型在卡納達語上進行微調的自動語音識別(ASR)模型,使用OpenSLR SLR79數據集訓練。
語音識別 其他
W
amoghsgopadi
2,200
1
Wav2vec2 Large Xlsr 53 Dhivehi V2
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型,使用普通語音的迪維希語數據進行了微調的自動語音識別模型。
語音識別
Transformers 其他

W
shahukareem
31
3
Wav2vec2 Large Xls R 300m Sakha
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在雅庫特語(SAH)數據集上微調的自動語音識別模型
語音識別
Transformers 其他

W
infinitejoy
18
0
Wav2vec2 Xls R 300m Ab CV8
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在common_voice數據集上微調的版本,用於阿布哈茲語的自動語音識別任務。
語音識別
Transformers 其他

W
emre
20
0
Wav2vec2 Xls R 300m Gn Cv8 4
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m模型在Common Voice 8.0數據集上微調的自動語音識別(ASR)模型,專門針對瓜拉尼語(gn)優化。
語音識別
Transformers 其他

W
lgris
17
0
Xls R Ab Test
這是一個基於XLS-R架構在Common Voice阿布哈茲語(ab)數據集上微調的自動語音識別模型
語音識別
Transformers 其他

X
baaastien
17
0
Wav2vec2 Large Xlsr Persian
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在波斯語(Farsi)上微調的自動語音識別模型,支持16kHz採樣率的語音輸入。
語音識別 其他
W
m3hrdadfi
562
16
Wav2vec2 Large Xlsr 53 Odia
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53微調的奧里亞語自動語音識別模型,使用低資源印度語言挑戰賽數據訓練
語音識別
Transformers 其他

W
theainerd
83
3
Wav2vec2 Large Xlsr Mr 3
Apache-2.0
這是一個基於facebook/wav2vec2-large-xlsr-53模型微調的馬拉地語自動語音識別(ASR)模型,使用OpenSLR和InterSpeech 2021數據集訓練。
語音識別 其他
W
gchhablani
22
0
Wav2vec2 Large Xlsr 53 Dhivehi
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的迪維希語自動語音識別模型,詞錯誤率(WER)為32.85%。
語音識別
Transformers 其他

W
shahukareem
20
1
Wav2vec2 Large Xlsr Bengali
基於 facebook/wav2vec2-large-xlsr-53 微調的孟加拉語自動語音識別模型,使用 OpenSLR 數據集中的4萬條語音訓練
語音識別 其他
W
arijitx
758
6
Wav2vec2 Xlsr Chuvash
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在楚瓦什語上的微調模型,用於自動語音識別任務。
語音識別 其他
W
gagan3012
54
0
Wav2vec2 Large Xlsr Breton
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在布列塔尼語Common Voice數據集上微調的語音識別模型
語音識別 其他
W
cahya
25
1
Wav2vec2 Large Xls R 300m Kurdish
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m在庫爾曼吉庫爾德語數據集上微調的自動語音識別(ASR)模型。
語音識別
Transformers 其他

W
infinitejoy
81
4
Wav2vec2 Xls R 300m Gn Cv8 3
Apache-2.0
基於facebook/wav2vec2-xls-r-300m模型在瓜拉尼語(gn)Common Voice 8.0數據集上微調的自動語音識別(ASR)模型
語音識別
Transformers 其他

W
lgris
17
0
Wav2vec2 Large Xls R 300m Gn K1
Apache-2.0
該模型是基於Facebook的wav2vec2-xls-r-300m模型,在MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - GN數據集上進行微調的自動語音識別模型,支持瓜拉尼語(gn)。
語音識別
Transformers 其他

W
DrishtiSharma
22
0
Wav2vec2 Xls R 300m Pa IN R5
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m模型在旁遮普語(印度)數據集上微調的自動語音識別模型。
語音識別
Transformers

W
DrishtiSharma
25
0
Wav2vec2 Xls R Myv A1
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在Erzya語言(MYV)數據集上微調的自動語音識別(ASR)模型,在Common Voice 8測試集上取得了65.15%的詞錯誤率(WER)。
語音識別
Transformers 其他

W
DrishtiSharma
24
0
Wav2vec2 Large Xls R 300m Hsb V3
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在上索布語(hsb)數據集上微調的自動語音識別模型
語音識別
Transformers 其他

W
DrishtiSharma
18
0
Wav2vec2 Large Xls R 300m Hsb V1
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m在上索布語(HSB)數據集上微調的自動語音識別模型,在Common Voice 8測試集上取得了0.4393的詞錯誤率(WER)。
語音識別
Transformers 其他

W
DrishtiSharma
20
0
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98