Parakeet Tdt Ctc 0.6b Ja
該模型是基於FastConformer架構的日語自動語音識別(ASR)模型,由NVIDIA開發並轉換為MLX格式。
語音識別
P
mlx-community
368
1
Parakeet Tdt 0.6b V2
基於 NVIDIA Parakeet TDT 0.6B v2 轉換的 MLX 格式自動語音識別模型,支持高效語音轉文本任務。
語音識別
P
mlx-community
24.49k
13
Stt Ru Fastconformer Hybrid Large Pc Onnx
NVIDIA FastConformer-Hybrid Large 是一個基於 FastConformer 架構的俄語自動語音識別模型,支持 CTC 和 RNN-T 解碼器。
語音識別
S
istupakov
163
1
Parakeet Tdt 0.6b V2
擁有6億參數的自動語音識別模型,支持英文轉錄、標點符號、大小寫和時間戳預測
語音識別 英語
P
nvidia
242.71k
957
Canary 180m Flash
NVIDIA NeMo Canary Flash 是一個多語言多任務語音模型,支持英語、德語、法語和西班牙語的自動語音識別和翻譯任務。
語音識別 支持多種語言
C
nvidia
15.17k
60
Stt Uz Fastconformer Hybrid Large Pc
這是一個基於FastConformer架構的大型烏茲別克語語音識別模型,支持Transducer和CTC雙重解碼,在多個測試集上表現出色。
語音識別 其他
S
nvidia
96
6
Parakeet Tdt Ctc 0.6b Ja
Parakeet TDT-CTC 0.6B是一個能夠轉錄帶標點符號的日語語音的自動語音識別(ASR)模型,由NVIDIA NeMo團隊開發。
語音識別 日語
P
nvidia
4,184
22
Canary 1b
Canary-1B是NVIDIA NeMo開發的多語言多任務模型,支持英語、德語、法語和西班牙語的自動語音識別和語音翻譯任務。
語音識別 支持多種語言
C
nvidia
7,734
421
Parakeet Ctc 0.6b
Parakeet CTC 0.6B是由NVIDIA NeMo和Suno.ai聯合開發的自動語音識別模型,基於FastConformer架構,擁有約6億參數,支持英語語音轉錄。
語音識別 英語
P
nvidia
6,528
13
Parakeet Rnnt 0.6b
Parakeet RNNT 0.6B 是由 NVIDIA NeMo 和 Suno.ai 聯合開發的自動語音識別模型,基於 FastConformer 架構,擁有約 6 億參數,專門用於將英語語音轉錄為文本。
語音識別 英語
P
nvidia
92.27k
8
Parakeet Ctc 1.1b
Parakeet CTC 1.1B是由NVIDIA NeMo和Suno.ai聯合開發的自動語音識別模型,基於FastConformer架構,擁有約11億參數,支持英語語音轉錄。
語音識別 英語
P
nvidia
14.78k
29
Parakeet Rnnt 1.1b
Parakeet RNNT 1.1B是由NVIDIA NeMo和Suno.ai聯合開發的自動語音識別模型,基於FastConformer Transducer架構,參數約11億,支持英語語音轉錄。
語音識別 英語
P
nvidia
13.18k
124
Stt Fa Fastconformer Hybrid Large
這是一個用於波斯語自動語音識別(ASR)的混合模型,結合了傳感器和CTC解碼器損失,基於FastConformer架構優化。
語音識別 其他
S
nvidia
2,398
9
Titu Stt Bn Fastconformer
基於FastConformer架構的孟加拉語自動語音識別模型,訓練數據約18K小時,支持高精度語音轉文本
語音識別 其他
T
hishab
270
13
Stt En Fastconformer Transducer Xlarge
NVIDIA FastConformer-Transducer 是一個用於英語自動語音識別(ASR)的高性能模型,採用優化的FastConformer架構和Transducer解碼器,參數規模約6.18億。
語音識別 英語
S
nvidia
106
24
Stt En Fastconformer Ctc Xlarge
NVIDIA FastConformer-CTC XLarge是一個約6億參數的自動語音識別(ASR)模型,專為英語語音轉錄設計,採用FastConformer架構和CTC損失訓練。
語音識別 英語
S
nvidia
216
2
Stt En Fastconformer Ctc Large
這是一個基於FastConformer架構的大型自動語音識別(ASR)模型,專門用於將英語語音轉錄為文本。
語音識別 英語
S
nvidia
1,001
12
Stt En Fastconformer Transducer Large
這是一個基於FastConformer架構的大型自動語音識別(ASR)模型,專門用於將英語語音轉錄為文本。
語音識別 英語
S
nvidia
1,398
7
Stt Ru Fastconformer Hybrid Large Pc
這是一個用於俄語自動語音識別的FastConformer混合模型,結合了Transducer和CTC解碼器,參數規模約1.15億。
語音識別 其他
S
nvidia
6,513
10
Stt Be Fastconformer Hybrid Large Pc
這是一個基於FastConformer架構的大型白俄羅斯語自動語音識別模型,結合了轉換器和CTC解碼器損失,在1500小時白俄羅斯語音數據上訓練。
語音識別 其他
S
nvidia
33
4
Stt Ua Fastconformer Hybrid Large Pc
NVIDIA FastConformer-Hybrid Large (ua) 是一個用於烏克蘭語語音識別的混合模型,結合了Transducer和CTC兩種損失函數訓練,參數約1.15億。
語音識別
S
nvidia
381
4
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98