Conformer架構

# Conformer架構

Asr Conformer Largescaleasr

這是一個基於SpeechBrain框架訓練的端到端自動語音識別系統，使用Conformer架構在25,000小時英文語音數據上訓練。

語音識別英語

Indicconformer Stt Ur Hybrid Ctc Rnnt Large

IndicConformer 是一個基於混合 CTC-RNNT 架構的 Conformer 自動語音識別模型，專門用於烏爾都語語音轉錄。

語音識別其他

Indicconformer Stt Ne Hybrid Ctc Rnnt Large

IndicConformer是一個基於混合CTC-RNNT架構的Conformer自動語音識別模型，專門針對尼泊爾語優化

語音識別其他

Indicconformer Stt Hi Hybrid Ctc Rnnt Large

IndicConformer是一個基於混合CTC-RNNT架構的Conformer自動語音識別(ASR)模型，支持印地語語音轉錄。

語音識別其他

基於Conformer架構的語音編碼器，在450萬小時無標註音頻數據上預訓練，支持143種以上語言

Transformers 支持多種語言

Fastspeech2 Conformer With Hifigan

整合FastSpeech2Conformer與HiFi-GAN的文本轉語音模型，提供高效高質量的語音合成

Transformers 英語

Fastspeech2 Conformer

FastSpeech2Conformer是一個非自迴歸的文本轉語音（TTS）模型，結合了FastSpeech2和Conformer架構的優勢，能夠快速高效地從文本生成高質量的語音。

Transformers 英語

Stt Rw Conformer Transducer Large

這是一個用於盧旺達語語音識別的Conformer-Transducer大型模型，能將語音轉錄為小寫拉丁字母，支持空格和撇號。

語音識別其他

Stt Zh Conformer Transducer Large

這是一個用於轉錄普通話語音的大型Conformer-Transducer模型，參數約1.2億，在AISHELL-2數據集上訓練。

語音識別中文

Stt Fr Conformer Ctc Large

這是一個基於Conformer架構的法語自動語音識別(ASR)大模型，採用CTC損失函數，在超過1500小時的法語語音數據上訓練而成。

語音識別法語

Stt De Conformer Transducer Large

這是一個用於德語自動語音識別的大型Conformer-Transducer模型，具有約1.2億參數，支持將德語語音轉錄為文本。

語音識別德語

Stt En Conformer Transducer Xlarge

這是一個由NVIDIA開發的自動語音識別(ASR)模型，基於Conformer-Transducer架構，擁有約6億參數，專門用於英語語音轉錄。

語音識別英語

Stt Kr Conformer Transducer Large

這是一個基於Conformer-Transducer架構的大規模韓語自動語音識別模型，在Ksponspeech數據集上訓練，適用於韓語語音轉錄任務。

語音識別其他

Wav2vec2 Conformer Rope Large 100h Ft

基於Librispeech 100小時語音數據微調的Wav2Vec2 Conformer模型，採用旋轉位置嵌入技術

Transformers 英語

Wav2vec2 Conformer Rel Pos Large 100h Ft

採用相對位置嵌入技術的Wav2Vec2-Conformer大型語音識別模型，基於Librispeech 100小時語音數據微調

Transformers 英語

Kan Bayashi Vctk Xvector Conformer Fastspeech2

基於ESPnet框架訓練的文本轉語音模型，使用VCTK數據集，支持多說話人語音合成

語音合成英語

Kan Bayashi Ljspeech Joint Finetune Conformer Fastspeech2 Hifigan

這是一個基於 ESPnet2 的文本轉語音(TTS)模型，使用 LJSpeech 數據集訓練，結合了 Conformer、FastSpeech2 和 HiFi-GAN 架構。

語音合成英語

Simpleoier Librispeech Asr Train Asr Conformer7 Wavlm Large Raw En Bpe5000 Sp

基於ESPnet框架訓練的自動語音識別(ASR)模型，使用Conformer架構和WavLM大型預訓練模型，在LibriSpeech數據集上訓練。

語音識別英語

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase