# Conformer架構

Asr Conformer Largescaleasr
Apache-2.0
這是一個基於SpeechBrain框架訓練的端到端自動語音識別系統,使用Conformer架構在25,000小時英文語音數據上訓練。
語音識別 英語
A
speechbrain
92
12
Indicconformer Stt Ur Hybrid Ctc Rnnt Large
MIT
IndicConformer 是一個基於混合 CTC-RNNT 架構的 Conformer 自動語音識別模型,專門用於烏爾都語語音轉錄。
語音識別 其他
I
ai4bharat
44
2
Indicconformer Stt Ne Hybrid Ctc Rnnt Large
MIT
IndicConformer是一個基於混合CTC-RNNT架構的Conformer自動語音識別模型,專門針對尼泊爾語優化
語音識別 其他
I
ai4bharat
36
2
Indicconformer Stt Hi Hybrid Ctc Rnnt Large
MIT
IndicConformer是一個基於混合CTC-RNNT架構的Conformer自動語音識別(ASR)模型,支持印地語語音轉錄。
語音識別 其他
I
ai4bharat
1,694
3
W2v Bert 2.0
MIT
基於Conformer架構的語音編碼器,在450萬小時無標註音頻數據上預訓練,支持143種以上語言
語音識別 Transformers 支持多種語言
W
facebook
477.05k
170
Fastspeech2 Conformer With Hifigan
Apache-2.0
整合FastSpeech2Conformer與HiFi-GAN的文本轉語音模型,提供高效高質量的語音合成
語音合成 Transformers 英語
F
espnet
635
0
Fastspeech2 Conformer
Apache-2.0
FastSpeech2Conformer是一個非自迴歸的文本轉語音(TTS)模型,結合了FastSpeech2和Conformer架構的優勢,能夠快速高效地從文本生成高質量的語音。
語音合成 Transformers 英語
F
espnet
2,440
6
Stt Rw Conformer Transducer Large
這是一個用於盧旺達語語音識別的Conformer-Transducer大型模型,能將語音轉錄為小寫拉丁字母,支持空格和撇號。
語音識別 其他
S
nvidia
116
1
Stt Zh Conformer Transducer Large
這是一個用於轉錄普通話語音的大型Conformer-Transducer模型,參數約1.2億,在AISHELL-2數據集上訓練。
語音識別 中文
S
nvidia
72
13
Stt Fr Conformer Ctc Large
這是一個基於Conformer架構的法語自動語音識別(ASR)大模型,採用CTC損失函數,在超過1500小時的法語語音數據上訓練而成。
語音識別 法語
S
nvidia
361
6
Stt De Conformer Transducer Large
這是一個用於德語自動語音識別的大型Conformer-Transducer模型,具有約1.2億參數,支持將德語語音轉錄為文本。
語音識別 德語
S
nvidia
66
6
Stt En Conformer Transducer Xlarge
這是一個由NVIDIA開發的自動語音識別(ASR)模型,基於Conformer-Transducer架構,擁有約6億參數,專門用於英語語音轉錄。
語音識別 英語
S
nvidia
496
54
Stt Kr Conformer Transducer Large
這是一個基於Conformer-Transducer架構的大規模韓語自動語音識別模型,在Ksponspeech數據集上訓練,適用於韓語語音轉錄任務。
語音識別 其他
S
eesungkim
129
9
Wav2vec2 Conformer Rope Large 100h Ft
Apache-2.0
基於Librispeech 100小時語音數據微調的Wav2Vec2 Conformer模型,採用旋轉位置嵌入技術
語音識別 Transformers 英語
W
facebook
99
0
Wav2vec2 Conformer Rel Pos Large 100h Ft
Apache-2.0
採用相對位置嵌入技術的Wav2Vec2-Conformer大型語音識別模型,基於Librispeech 100小時語音數據微調
語音識別 Transformers 英語
W
facebook
99
0
Kan Bayashi Vctk Xvector Conformer Fastspeech2
基於ESPnet框架訓練的文本轉語音模型,使用VCTK數據集,支持多說話人語音合成
語音合成 英語
K
espnet
15
0
Kan Bayashi Ljspeech Joint Finetune Conformer Fastspeech2 Hifigan
這是一個基於 ESPnet2 的文本轉語音(TTS)模型,使用 LJSpeech 數據集訓練,結合了 Conformer、FastSpeech2 和 HiFi-GAN 架構。
語音合成 英語
K
espnet
20
16
Simpleoier Librispeech Asr Train Asr Conformer7 Wavlm Large Raw En Bpe5000 Sp
基於ESPnet框架訓練的自動語音識別(ASR)模型,使用Conformer架構和WavLM大型預訓練模型,在LibriSpeech數據集上訓練。
語音識別 英語
S
espnet
66
1
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase