Whisper Large V3 Cantonese
Apache-2.0
基於Whisper v3微調的粵語自動語音識別模型,在Common Voice 17數據集上訓練
語音識別
Transformers 其他

W
khleeloo
25
4
Distil Whisper Small Cantonese
Apache-2.0
這是一個基於Whisper Small的粵語語音識別蒸餾模型,在Common Voice 16.0上實現了9.7的CER(無標點符號)。
語音識別
Transformers 中文

D
alvanlii
187
7
Whisper Large V2 Cantonese
Apache-2.0
基於OpenAI Whisper Large V2模型微調的粵語自動語音識別(ASR)模型,在Common Voice 11.0粵語數據集上訓練,字錯誤率(CER)為6.21%。
語音識別
Transformers 其他

W
Scrya
210
7
Whisper Large V2 Cantonese
Apache-2.0
基於OpenAI Whisper Large V2在粵語數據集上微調的自動語音識別模型,在測試集上達到6.7274%的字錯誤率
語音識別
Transformers 其他

W
simonl0909
131
12
Whisper Small Cantonese
Apache-2.0
基於OpenAI Whisper-small微調的粵語語音識別模型,在Common Voice 16.0測試集上CER為7.93
語音識別
Transformers 支持多種語言

W
alvanlii
2,413
85
Wav2vec2 Large Xlsr 53 Cantonese
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型,使用Common Voice語料庫8.0版對粵語進行微調的語音識別模型
語音識別
Transformers 其他

W
CAiRE
1,214
3
Wav2vec2 Large Xlsr Cantonese
Apache-2.0
基於Facebook的wav2vec2-large-xlsr-53模型微調的粵語語音識別模型,支持16kHz採樣率的語音輸入。
語音識別 其他
W
ctl
1,010
12
Wav2vec2 Large Xls R 300m Cantonese
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m模型在粵語(香港)數據集上微調的自動語音識別(ASR)模型,專門用於處理粵語語音識別任務。
語音識別
Transformers 中文

W
ivanlau
42
1
Wav2vec2 Large Xlsr 53 Hk
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53在粵語(使用Common Voice數據集)上進行微調的語音識別模型
語音識別
Transformers

W
voidful
26
2
Wav2vec2 Xls R 300m Zh HK V2
Apache-2.0
基於XLS-R架構的粵語自動語音識別模型,在Common Voice粵語數據集上微調
語音識別
Transformers

W
w11wo
23
0
Wav2vec2 Xls R 300m Zh HK Lm V2
Apache-2.0
基於XLS-R架構的自動語音識別模型,針對粵語(zh-HK)優化,在Common Voice數據集上微調並加入5-gram語言模型。
語音識別
Transformers

W
w11wo
25
0
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98