FastConformer架構

# FastConformer架構

Parakeet Tdt Ctc 0.6b Ja

該模型是基於FastConformer架構的日語自動語音識別(ASR)模型，由NVIDIA開發並轉換為MLX格式。

Parakeet Tdt 0.6b V2

基於 NVIDIA Parakeet TDT 0.6B v2 轉換的 MLX 格式自動語音識別模型，支持高效語音轉文本任務。

Stt Ru Fastconformer Hybrid Large Pc Onnx

NVIDIA FastConformer-Hybrid Large 是一個基於 FastConformer 架構的俄語自動語音識別模型，支持 CTC 和 RNN-T 解碼器。

Parakeet Tdt 0.6b V2

擁有6億參數的自動語音識別模型，支持英文轉錄、標點符號、大小寫和時間戳預測

語音識別英語

Canary 180m Flash

NVIDIA NeMo Canary Flash 是一個多語言多任務語音模型，支持英語、德語、法語和西班牙語的自動語音識別和翻譯任務。

語音識別支持多種語言

Stt Uz Fastconformer Hybrid Large Pc

這是一個基於FastConformer架構的大型烏茲別克語語音識別模型，支持Transducer和CTC雙重解碼，在多個測試集上表現出色。

語音識別其他

Parakeet Tdt Ctc 0.6b Ja

Parakeet TDT-CTC 0.6B是一個能夠轉錄帶標點符號的日語語音的自動語音識別(ASR)模型，由NVIDIA NeMo團隊開發。

語音識別日語

Canary-1B是NVIDIA NeMo開發的多語言多任務模型，支持英語、德語、法語和西班牙語的自動語音識別和語音翻譯任務。

語音識別支持多種語言

Parakeet Ctc 0.6b

Parakeet CTC 0.6B是由NVIDIA NeMo和Suno.ai聯合開發的自動語音識別模型，基於FastConformer架構，擁有約6億參數，支持英語語音轉錄。

語音識別英語

Parakeet Rnnt 0.6b

Parakeet RNNT 0.6B 是由 NVIDIA NeMo 和 Suno.ai 聯合開發的自動語音識別模型，基於 FastConformer 架構，擁有約 6 億參數，專門用於將英語語音轉錄為文本。

語音識別英語

Parakeet Ctc 1.1b

Parakeet CTC 1.1B是由NVIDIA NeMo和Suno.ai聯合開發的自動語音識別模型，基於FastConformer架構，擁有約11億參數，支持英語語音轉錄。

語音識別英語

Parakeet Rnnt 1.1b

Parakeet RNNT 1.1B是由NVIDIA NeMo和Suno.ai聯合開發的自動語音識別模型，基於FastConformer Transducer架構，參數約11億，支持英語語音轉錄。

語音識別英語

Stt Fa Fastconformer Hybrid Large

這是一個用於波斯語自動語音識別(ASR)的混合模型，結合了傳感器和CTC解碼器損失，基於FastConformer架構優化。

語音識別其他

Titu Stt Bn Fastconformer

基於FastConformer架構的孟加拉語自動語音識別模型，訓練數據約18K小時，支持高精度語音轉文本

語音識別其他

Stt En Fastconformer Transducer Xlarge

NVIDIA FastConformer-Transducer 是一個用於英語自動語音識別(ASR)的高性能模型，採用優化的FastConformer架構和Transducer解碼器，參數規模約6.18億。

語音識別英語

Stt En Fastconformer Ctc Xlarge

NVIDIA FastConformer-CTC XLarge是一個約6億參數的自動語音識別(ASR)模型，專為英語語音轉錄設計，採用FastConformer架構和CTC損失訓練。

語音識別英語

Stt En Fastconformer Ctc Large

這是一個基於FastConformer架構的大型自動語音識別(ASR)模型，專門用於將英語語音轉錄為文本。

語音識別英語

Stt En Fastconformer Transducer Large

這是一個基於FastConformer架構的大型自動語音識別(ASR)模型，專門用於將英語語音轉錄為文本。

語音識別英語

Stt Ru Fastconformer Hybrid Large Pc

這是一個用於俄語自動語音識別的FastConformer混合模型，結合了Transducer和CTC解碼器，參數規模約1.15億。

語音識別其他

Stt Be Fastconformer Hybrid Large Pc

這是一個基於FastConformer架構的大型白俄羅斯語自動語音識別模型，結合了轉換器和CTC解碼器損失，在1500小時白俄羅斯語音數據上訓練。

語音識別其他

Stt Ua Fastconformer Hybrid Large Pc

NVIDIA FastConformer-Hybrid Large (ua) 是一個用於烏克蘭語語音識別的混合模型，結合了Transducer和CTC兩種損失函數訓練，參數約1.15億。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase