Whisper Small Vi
MIT
基於openai/whisper-small針對越南語語音數據微調的自動語音識別模型,提升越南語轉錄準確性和魯棒性
語音識別
Transformers 其他

W
namphungdn134
334
2
Faster Distil Whisper Large V3.5
MIT
Distil-Whisper是Whisper模型的蒸餾版本,針對自動語音識別(ASR)任務進行了優化,提供更快的推理速度。
語音識別 英語
F
Purfview
565
2
Whisper Large V3 Turbo Gguf
MIT
Whisper large-v3-turbo 是基於 Whisper large-v3 的剪枝微調版本,解碼層數從32減少到4,速度大幅提升但質量略有下降。
語音識別 支持多種語言
W
xkeyC
546
1
Whisper Base Vi
MIT
基於openai/whisper-base模型在100小時越南語語音數據上微調的語音識別模型,提升越南語轉錄準確性
語音識別
Transformers 其他

W
namphungdn134
215
3
Distil Large V3.5 Ct2
MIT
Distil-Whisper是Whisper模型的蒸餾版本,通過大規模偽標籤技術實現高效語音識別
語音識別 英語
D
distil-whisper
264
3
Whisper Small Sinhala
Apache-2.0
基於OpenAI Whisper-small微調的僧伽羅語語音識別模型
語音識別
Transformers 其他

W
Lingalingeswaran
667
2
Moonshine Base ONNX
MIT
基於Moonshine基礎模型的ONNX格式自動語音識別模型,支持高效推理
語音識別
Transformers

M
onnx-community
1,171
29
Whisper Large V3 Distil Multi4 V0.2
MIT
這是一個多語言蒸餾版的Whisper模型,具有2個解碼器層,支持4種歐洲語言:英語、法語、西班牙語和德語。
語音識別
Transformers 支持多種語言

W
bofenghuang
70
1
Whisper Medium Vaani Telugu
MIT
基於OpenAI Whisper-small架構的泰盧固語自動語音識別模型,由ARTPARK-IISc團隊針對印度語言優化
語音識別 其他
W
ARTPARK-IISc
26
1
Moonshine Base
MIT
Moonshine是由Useful Sensors開發的自動語音識別(ASR)模型系列,專為英文語音轉錄設計,在資源受限平臺上表現優異。
語音識別
Transformers 英語

M
UsefulSensors
6,857
32
Moonshine Tiny
MIT
月光模型是由Useful Sensors開發的自動語音識別(ASR)模型,專注於在資源受限設備上實現高效的英語語音轉錄。
語音識別
Transformers 英語

M
UsefulSensors
7,848
16
Whisper Base
Whisper是一個自動語音識別(ASR)系統,由OpenAI訓練,支持多語言語音轉錄。
語音識別
Transformers

W
onnx-community
5,704
19
Faster Distil Whisper Large V3
MIT
Whisper Large v3的蒸餾版本,用於高效自動語音識別(ASR)
語音識別 英語
F
Systran
18.55k
49
Distil Whisper Large V3
Apache-2.0
該模型是從GGML格式的distil-whisper/distil-large-v3-ggml轉換至Ratchet自定義格式的版本,主要用於語音識別任務。
語音識別
D
FL33TW00D-HF
164
4
Distil Large V3 Ct2
MIT
Distil-Whisper是Whisper模型的蒸餾版本,針對長文本轉錄進行了優化,提供更快的推理速度和更高的詞錯誤率(WER)性能。
語音識別 英語
D
distil-whisper
58
6
Whisper Large V3
Whisper-large-v3是OpenAI開源的自動語音識別(ASR)模型,支持多種語言的語音轉文字任務。
語音識別
Transformers

W
Xenova
1,443
9
Distil Medium.en
MIT
Distil-Whisper是Whisper模型的蒸餾版本,速度比原版快6倍,體積縮小49%,在英語語音識別任務上保持接近原版的性能。
語音識別 英語
D
distil-whisper
186.85k
120
Whisper Small Ml
Apache-2.0
該模型是基於openai/whisper-small微調的語音識別模型,支持多種語言,適用於自動語音識別任務。
語音識別
Transformers

W
kavyamanohar
23
2
Whisper Small Turkish Tr Best
Apache-2.0
基於OpenAI Whisper-small微調的土耳其語語音識別模型,詞錯誤率26.34%
語音識別
Transformers

W
erenfazlioglu
61
4
Whisper Medium
Whisper Medium 是 OpenAI 開發的中等規模語音識別模型,支持多種語言的自動語音識別(ASR)任務。
語音識別
Transformers

W
Xenova
871
4
Whisper Small
Whisper Small 是 OpenAI 開發的一個小型自動語音識別(ASR)模型,能夠將語音轉換為文本。
語音識別
Transformers

W
Xenova
1,716
9
Whisper Base
Whisper是一個自動語音識別(ASR)系統,由OpenAI訓練,支持多種語言的語音轉文本任務。
語音識別
Transformers

W
Xenova
6,204
7
Whisper Medium Arabic
Apache-2.0
基於openai/whisper-medium微調的阿拉伯語語音識別模型,支持流式處理
語音識別
Transformers

W
Seyfelislem
1,832
5
Wav2vec2 Base 960h Finetuned Common Voice3
Apache-2.0
基於facebook/wav2vec2-base-960h微調的語音識別模型,適用於通用語音識別任務
語音識別
Transformers

W
obokkkk
20
0
Waynehills STT Doogie Server
Apache-2.0
基於Doogie/Waynehills-STT-doogie-server微調的語音識別模型
語音識別
Transformers

W
Waynehillsdev
28
0
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98