Whisper Large V3 Turbo
MIT
Whisper是OpenAI開發的最先進的自動語音識別(ASR)和語音翻譯模型,在超過500萬小時的標記數據上訓練,具有強大的零樣本泛化能力。Turbo版本是原版的修剪微調版本,解碼層從32層減少到4層,速度大幅提升但質量略有下降。
語音識別
Transformers 支持多種語言

W
unsloth
94
1
Whisper Large V3
Apache-2.0
Whisper是OpenAI開發的最先進的自動語音識別(ASR)和語音翻譯模型,支持多種語言
語音識別
Safetensors 支持多種語言
W
unsloth
4,002
1
Aero 1 Audio
MIT
輕量級音頻模型,擅長語音識別、音頻理解及執行音頻指令等多元任務
音頻生成文本
Transformers 英語

A
lmms-lab
1,348
74
Quantum STT
Apache-2.0
Quantum_STT 是一種先進的自動語音識別(ASR)和語音翻譯模型,基於大規模弱監督訓練,支持多種語言和任務。
語音識別
Transformers 支持多種語言

Q
sbapan41
100
1
Whisper Large V3 Turbo Gguf
MIT
Whisper large-v3-turbo 是基於 Whisper large-v3 的剪枝微調版本,解碼層數從32減少到4,速度大幅提升但質量略有下降。
語音識別 支持多種語言
W
xkeyC
546
1
Whisper Large V3 Vaani Hindi
Apache-2.0
基於OpenAI的Whisper-Large-V3模型微調的印地語語音識別模型,訓練數據包含約718小時的印地語轉錄語音
語音識別
Safetensors
W
ARTPARK-IISc
15.55k
3
Whisper Small Tel
Apache-2.0
基於OpenAI Whisper-large-v2在泰盧固語音頻數據集上微調的語音識別模型
語音識別
Transformers 其他

W
sagarchapara
17
1
Whisper Large V3 Turbo
MIT
Whisper large-v3-turbo 是 OpenAI 提出的自動語音識別和語音翻譯模型,基於大規模弱監督訓練,支持多種語言。
語音識別
Transformers 支持多種語言

W
Daemontatox
26
1
Chunkformer Large Vie
基於ChunkFormer架構的大規模越南語自動語音識別模型,在約3000小時的越南語公開語音數據上微調,性能優異。
語音識別 其他
C
khanhld
1,765
12
Distil Large V3.5
MIT
Distil-Whisper是OpenAI Whisper-Large-v3的知識蒸餾版本,通過大規模偽標籤訓練實現高效語音識別。
語音識別
Transformers 英語

D
distil-whisper
4,804
25
Whisper Large V3 Turbo Common Voice 19 0 Zh TW
MIT
基於OpenAI Whisper-large-v3-turbo微調的繁體中文(臺灣)自動語音識別模型
語音識別
Transformers 中文

W
JacobLinCool
220
4
Whisper Large V3 Turbo Turkish
MIT
基於openai/whisper-large-v3-turbo在Common Voice 17.0數據集上微調的土耳其語語音識別模型
語音識別
Transformers 其他

W
selimc
289
6
Whisper Large V3 Turbo
Apache-2.0
Whisper large-v3-turbo是OpenAI Whisper large-v3的蒸餾版本,解碼層從32層減少到4層,速度大幅提升但質量略有下降。
語音識別 支持多種語言
W
deepdml
883
6
Whisper Large V3 Turbo
MIT
Whisper是由OpenAI開發的最先進的自動語音識別(ASR)和語音翻譯模型,經過超過500萬小時標記數據的訓練,在零樣本設置下展現出強大的泛化能力。
語音識別
Transformers 支持多種語言

W
openai
4.0M
2,317
Kotoba Whisper V2.0 Faster
MIT
適用於CTranslate2的Whisper語音識別模型,專為日語優化,提供高效的語音轉文本功能。
語音識別 日語
K
kotoba-tech
202
14
Faster Whisper Large V3 Ru Podlodka Int8
Apache-2.0
這是基於OpenAI Whisper架構的俄語語音識別模型,專為俄語語音轉文本任務優化,並轉換為ctranslate2格式以提高推理效率。
語音識別 其他
F
bzikst
29
3
Whisper Tiny En
其他
專為移動部署優化的英文語音識別和翻譯模型,由高通實現
語音識別
PyTorch
W
qualcomm
3,269
7
Nb Whisper Base
Apache-2.0
挪威國家圖書館開發的自動語音識別模型,基於OpenAI Whisper架構,支持挪威語和英語轉錄
語音識別
Transformers

N
NbAiLab
1,629
2
Nb Whisper Large
Apache-2.0
挪威國家圖書館推出的挪威語自動語音識別模型,基於OpenAI的Whisper架構開發,支持多種挪威語方言和英語。
語音識別
Transformers 支持多種語言

N
NbAiLab
5,214
26
Audio Transcribe
這是一個基於Transformers的自動語音識別(ASR)模型,用於將音頻文件轉錄為文本。
語音識別
A
washeed
257
4
Nb Whisper Large
Apache-2.0
挪威國家圖書館研發的自動語音識別模型,基於Whisper架構,支持挪威語和英語的語音轉錄與翻譯。
語音識別
Transformers

N
NbAiLabBeta
776
9
Distil Small.en
MIT
Distil-Whisper是Whisper模型的蒸餾版本,速度快6倍,體積縮小49%,在非分佈評估集上表現接近1% WER。
語音識別
Transformers 英語

D
distil-whisper
33.51k
97
Whisper Large V3 German
Apache-2.0
基於Whisper Large v3的德語語音識別微調模型,針對德語語音處理和識別進行了優化
語音識別
Transformers 德語

W
primeline
8,745
70
Whisper Large V3
Apache-2.0
Whisper是由OpenAI提出的先進自動語音識別(ASR)和語音翻譯模型,在超過500萬小時的標註數據上訓練,具有強大的跨數據集和跨領域泛化能力。
語音識別 支持多種語言
W
openai
4.6M
4,321
Distil Medium.en
MIT
Distil-Whisper是Whisper模型的蒸餾版本,速度比原版快6倍,體積縮小49%,在英語語音識別任務上保持接近原版的性能。
語音識別 英語
D
distil-whisper
186.85k
120
Distil Large V2
MIT
Distil-Whisper是Whisper模型的蒸餾版本,速度提升6倍,體積縮小49%,在非分佈評估集上的表現僅相差1% WER。
語音識別 英語
D
distil-whisper
42.65k
508
Whisper Tamil Large V2
Apache-2.0
基於OpenAI Whisper-large-v2微調的泰米爾語語音識別模型,在多個公開泰米爾語ASR語料庫上訓練
語音識別 其他
W
vasista22
325
7
Whisper Medium.en
Apache-2.0
Whisper是OpenAI開發的自動語音識別(ASR)模型,經過68萬小時標註語音數據訓練,具有強大的泛化能力。
語音識別 英語
W
openai
36.92k
53
Wav2vec2 Large Xls R 300m Bg
Apache-2.0
基於facebook/wav2vec2-xls-r-300m在Common Voice 8保加利亞語數據集上微調的自動語音識別模型
語音識別
Transformers 其他

W
anuragshas
1,469
0
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98