Whisper Large V3 Turbo
MIT
Whisper是OpenAI開發的最先進的自動語音識別(ASR)和語音翻譯模型,在超過500萬小時的標記數據上訓練,具有強大的零樣本泛化能力。Turbo版本是原版的修剪微調版本,解碼層從32層減少到4層,速度大幅提升但質量略有下降。
語音識別
Transformers 支持多種語言

W
unsloth
94
1
Whisper Large V3
Apache-2.0
Whisper是OpenAI開發的最先進的自動語音識別(ASR)和語音翻譯模型,支持多種語言
語音識別
Safetensors 支持多種語言
W
unsloth
4,002
1
Erax WoW Turbo V1.1 CT2
MIT
基於CTranslate2優化的Whisper Large-v3 Turbo越南語增強本地化版,支持多語言語音識別,速度快、準確度高
語音識別
Transformers 其他

E
erax-ai
1,283
7
Erax WoW Turbo V1.1
MIT
專為越南語優化的Whisper Large-v3 Turbo語音識別模型,支持多語言,具有極速響應和高準確度
語音識別
Transformers 其他

E
erax-ai
666
11
Gigaam Rnnt
MIT
GigaAM-v2-RNNT 是一個俄語自動語音識別(ASR)模型,基於RNNT架構,適用於語音轉文本任務。
語音識別
Transformers 其他

G
waveletdeboshir
70
1
Gigaam Ctc
MIT
GigaAM-v2-CTC 是一個俄語自動語音識別(ASR)模型,基於CTC損失函數訓練,可通過Hugging Face transformers庫使用。
語音識別
Transformers 其他

G
waveletdeboshir
255
1
Erax WoW Turbo V1.0
MIT
專為越南語優化的Whisper Large-v3 Turbo語音識別模型,支持多語言即時轉錄
語音識別
Transformers 其他

E
erax-ai
655
49
Disper Small Salam
Apache-2.0
基於OpenAI Whisper-small微調的阿拉伯語語音識別模型
語音識別
Transformers 阿拉伯語

D
Duino
14
1
Whisper Large V3 Turbo
Apache-2.0
Whisper large-v3-turbo是OpenAI Whisper large-v3的蒸餾版本,解碼層從32層減少到4層,速度大幅提升但質量略有下降。
語音識別 支持多種語言
W
deepdml
883
6
Whisper Large V3 Atco2 Asr
Apache-2.0
基於OpenAI Whisper-large-v3微調的語音識別模型,專注於航空交通管制(ATCO)場景,詞錯誤率17.04%
語音識別
Transformers

W
jlvdoorn
1,792
5
Uzbek Stt
Apache-2.0
由Oyqiz團隊開發的烏茲別克語自動語音識別(ASR)模型,基於Common Voice 10.0數據集訓練
語音識別
Transformers 其他

U
oyqiz
425
5
Whisper Kannada Tiny
Apache-2.0
基於openai/whisper-tiny微調的卡納達語自動語音識別模型,在多個公開卡納達語ASR語料庫上訓練
語音識別 其他
W
vasista22
119
6
Whisper Tiny
Apache-2.0
Whisper Tiny是OpenAI開發的自動語音識別(ASR)模型,屬於Whisper系列中最小的版本,參數規模為39M。
語音識別 支持多種語言
W
openai
328.82k
318
Wav2vec2 Large Xls R 300m Singlish Colab
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在新加坡英語(li_singlish)數據集上微調的語音識別模型
語音識別
Transformers

W
RuiqianLi
22
1
Wav2vec2 Large Xlsr 53 Punjabi
Apache-2.0
這是一個基於Harveenchadha/vakyansh-wav2vec2-punjabi-pam-10在Common Voice數據集上微調的旁遮普語自動語音識別模型
語音識別
Transformers 其他

W
kingabzpro
189
2
Wav2vec2 Xls R Hindi
Apache-2.0
這是一個基於facebook/wav2vec2-xls-r-300m在印地語Common Voice 7.0數據集上微調的自動語音識別(ASR)模型
語音識別
Transformers 其他

W
shivam
19
1
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98