Parakeet Tdt 0.6b V2 Mlx
這是一個自動語音識別模型,已轉換為適用於MLX的版本,可快速進行推理。
語音識別
Safetensors 英語
P
senstella
183
6
Faster Distil Whisper Large V3.5
MIT
Distil-Whisper是Whisper模型的蒸餾版本,針對自動語音識別(ASR)任務進行了優化,提供更快的推理速度。
語音識別 英語
F
Purfview
565
2
Faster Distil Whisper Large V3.5
MIT
基於Distil-Whisper large-v3.5轉換的CTranslate2格式模型,用於高效語音識別
語音識別 英語
F
deepdml
58.15k
2
Distil Large V3.5 ONNX
MIT
Distil-Whisper是OpenAI Whisper-Large-v3的知識蒸餾版本,提供更優的性能表現和高效性。
語音識別
Transformers 英語

D
distil-whisper
25
1
Distil Large V3.5 Ct2
MIT
Distil-Whisper是Whisper模型的蒸餾版本,通過大規模偽標籤技術實現高效語音識別
語音識別 英語
D
distil-whisper
264
3
Distil Large V3.5
MIT
Distil-Whisper是OpenAI Whisper-Large-v3的知識蒸餾版本,通過大規模偽標籤訓練實現高效語音識別。
語音識別
Transformers 英語

D
distil-whisper
4,804
25
Faster Whisper V2 D4
Apache-2.0
這是一個基於Whisper模型優化的希伯來語和英語語音識別模型,由ivrit.ai開發。
語音識別 支持多種語言
F
ivrit-ai
696
16
Distil Large V3
MIT
Distil-Whisper是Whisper large-v3的知識蒸餾版本,專注於英語自動語音識別,提供更快的推理速度同時保持接近原始模型的準確性。
語音識別 英語
D
distil-whisper
417.11k
311
Parakeet Tdt 1.1b
Parakeet TDT 1.1B是由NVIDIA NeMo和Suno.ai聯合開發的自動語音識別(ASR)模型,能夠將語音轉錄為小寫英文字母。
語音識別 英語
P
nvidia
12.27k
90
Faster Distil Whisper Medium.en
MIT
這是distil-whisper/distil-medium.en模型轉換為CTranslate2格式的版本,用於高效語音識別任務。
語音識別 英語
F
Systran
6,155
4
Faster Distil Whisper Large V2
MIT
這是一個基於Whisper架構的蒸餾版本自動語音識別(ASR)模型,專為高效推理設計,適用於英語語音轉文本任務。
語音識別 英語
F
Systran
1,336
19
Sew D Mid K127 400k Ft Ls100h
Apache-2.0
SEW-D-mid-k127是由ASAPP Research開發的高效語音識別預訓練模型,在性能和效率方面相比wav2vec 2.0有顯著改進。
語音識別
Transformers 英語

S
asapp
16
0
Sew D Tiny 100k Ft Ls100h
Apache-2.0
SEW-D-tiny 是由 ASAPP Research 開發的高效語音識別預訓練模型,專注於性能和效率的平衡。
語音識別
Transformers 英語

S
asapp
24.55k
2
Sew D Base Plus 400k Ft Ls100h
Apache-2.0
SEW-D-base+ 是由 ASAPP Research 開發的高效語音識別模型,基於 16kHz 採樣的語音音頻進行預訓練,在 LibriSpeech 數據集上表現出色。
語音識別
Transformers 英語

S
asapp
66
4
Sew Tiny 100k Ft Ls100h
Apache-2.0
SEW(壓縮高效版Wav2vec)是由ASAPP Research開發的語音識別預訓練模型,在性能和效率上優於wav2vec 2.0
語音識別
Transformers 支持多種語言

S
asapp
736
1
Sew D Mid 400k Ft Ls100h
Apache-2.0
SEW-D-mid是由ASAPP Research開發的語音預訓練模型,專注於自動語音識別任務,在性能和效率之間取得了良好平衡。
語音識別
Transformers 英語

S
asapp
20
1
Sew Tiny 100k
Apache-2.0
SEW-tiny是由ASAPP Research開發的壓縮高效型語音預訓練模型,基於16kHz採樣的語音音頻進行預訓練,適用於多種下游語音任務。
語音識別
Transformers 支持多種語言

S
asapp
1,080
3
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98