# 英語語音轉寫

Parakeet Ctc 0.6b
Parakeet CTC 0.6B是由NVIDIA NeMo和Suno.ai聯合開發的自動語音識別模型,基於FastConformer架構,擁有約6億參數,支持英語語音轉錄。
語音識別 英語
P
nvidia
6,528
13
Parakeet Rnnt 1.1b
Parakeet RNNT 1.1B是由NVIDIA NeMo和Suno.ai聯合開發的自動語音識別模型,基於FastConformer Transducer架構,參數約11億,支持英語語音轉錄。
語音識別 英語
P
nvidia
13.18k
124
Faster Whisper Base.en
MIT
這是一個基於CTranslate2轉換的Whisper base.en模型,用於英語語音識別任務。
語音識別 英語
F
Systran
367.44k
4
Stt En Fastconformer Ctc Large
這是一個基於FastConformer架構的大型自動語音識別(ASR)模型,專門用於將英語語音轉錄為文本。
語音識別 英語
S
nvidia
1,001
12
Stt En Citrinet 1024 Gamma 0 25
NVIDIA流式Citrinet 1024是一個用於英語自動語音識別的非自迴歸模型,基於CTC損失/解碼,擁有約1.4億參數。
語音識別 英語
S
nvidia
156
3
Stt En Conformer Transducer Xlarge
這是一個由NVIDIA開發的自動語音識別(ASR)模型,基於Conformer-Transducer架構,擁有約6億參數,專門用於英語語音轉錄。
語音識別 英語
S
nvidia
496
54
Assignment1 Joane
MIT
一個用於自動語音識別(ASR)的語音到文本轉換器(S2T)模型
語音識別 Transformers 英語
A
Classroom-workshop
22
0
Assignment1 Jane
MIT
s2t-small-librispeech-asr 是一個用於自動語音識別(ASR)的語音到文本轉換器(S2T)模型,基於序列到序列轉換器架構。
語音識別 Transformers 英語
A
Classroom-workshop
29
0
Wav2vec2 Large 960h Lv60 Self With Wikipedia Lm
基於Facebook的wav2vec2-large-960h-lv60-self模型,通過增強維基百科語言模型改進的自動語音識別(ASR)系統
語音識別 Transformers
W
gxbag
15
2
Wav2vec2 Large 960h Lv60 Self 4 Gram
Apache-2.0
基於Facebook Wav2Vec2-Large-960h-lv60-self模型,增加了英語4-gram語言模型以提升語音識別準確率
語音識別 英語
W
patrickvonplaten
22
4
Wav2vec2 Base 960h 4 Gram
Apache-2.0
基於Facebook的Wav2Vec2-Base-960h模型,增加了英語4-gram語言模型,用於提高自動語音識別(ASR)的準確率。
語音識別 Transformers 英語
W
patrickvonplaten
19
0
Wav2vec2 Tiny Random Robust
Apache-2.0
一個輕量級的自動語音識別(ASR)模型,基於Wav2Vec2架構的隨機初始化版本,專為魯棒性測試設計。
語音識別 Transformers 英語
W
patrickvonplaten
406
0
Wav2vec2 Large 960h Lv60 Self
Apache-2.0
Facebook開發的Wav2Vec2大模型,基於960小時Libri-Light和Librispeech語音數據預訓練和微調,採用自訓練目標,在LibriSpeech測試集上達到SOTA效果。
語音識別 英語
W
facebook
56.00k
146
Wavlm Libri Clean 100h Base
基於microsoft/wavlm-base在LIBRISPEECH_ASR - CLEAN數據集上微調的自動語音識別模型
語音識別 Transformers
W
patrickvonplaten
6,515
1
Wav2vec2 Base 960h
Apache-2.0
Wav2Vec2是一個基於自監督學習的語音識別模型,由Facebook開發,在LibriSpeech數據集上訓練,支持英語語音轉文本任務。
語音識別 Transformers 英語
W
tommy19970714
19
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase