# FastConformerアーキテクチャ

Parakeet Tdt Ctc 0.6b Ja
このモデルはFastConformerアーキテクチャに基づく日本語自動音声認識(ASR)モデルで、NVIDIAによって開発されMLXフォーマットに変換されました。
音声認識
P
mlx-community
368
1
Parakeet Tdt 0.6b V2
NVIDIA Parakeet TDT 0.6B v2 を変換したMLXフォーマットの自動音声認識モデルで、効率的な音声テキスト変換タスクをサポートします。
音声認識
P
mlx-community
24.49k
13
Stt Ru Fastconformer Hybrid Large Pc Onnx
NVIDIA FastConformer-Hybrid Large は、FastConformer アーキテクチャに基づくロシア語自動音声認識モデルで、CTC と RNN-T デコーダーをサポートしています。
音声認識
S
istupakov
163
1
Parakeet Tdt 0.6b V2
6億パラメータを持つ自動音声認識モデルで、英語の文字起こし、句読点、大文字小文字、タイムスタンプ予測をサポート
音声認識 英語
P
nvidia
242.71k
957
Canary 180m Flash
NVIDIA NeMo Canary Flash は、英語、ドイツ語、フランス語、スペイン語の自動音声認識と翻訳タスクをサポートする多言語多機能音声モデルです。
音声認識 複数言語対応
C
nvidia
15.17k
60
Stt Uz Fastconformer Hybrid Large Pc
これはFastConformerアーキテクチャに基づく大型ウズベク語音声認識モデルで、TransducerとCTCの二重デコードをサポートし、複数のテストセットで優れた性能を発揮します。
音声認識 その他
S
nvidia
96
6
Parakeet Tdt Ctc 0.6b Ja
Parakeet TDT-CTC 0.6Bは句読点付きの日本語音声を転写できる自動音声認識(ASR)モデルで、NVIDIA NeMoチームによって開発されました。
音声認識 日本語
P
nvidia
4,184
22
Canary 1b
Canary-1BはNVIDIA NeMoが開発した多言語マルチタスクモデルで、英語、ドイツ語、フランス語、スペイン語の自動音声認識と音声翻訳タスクをサポートします。
音声認識 複数言語対応
C
nvidia
7,734
421
Parakeet Ctc 0.6b
Parakeet CTC 0.6BはNVIDIA NeMoとSuno.aiが共同開発した自動音声認識モデルで、FastConformerアーキテクチャに基づき、約6億のパラメータを持ち、英語音声の書き起こしをサポートします。
音声認識 英語
P
nvidia
6,528
13
Parakeet Rnnt 0.6b
Parakeet RNNT 0.6B は、NVIDIA NeMo と Suno.ai が共同開発した自動音声認識モデルで、FastConformer アーキテクチャを基にし、約6億のパラメータを持ち、英語音声をテキストに転写するために特別に設計されています。
音声認識 英語
P
nvidia
92.27k
8
Parakeet Ctc 1.1b
Parakeet CTC 1.1BはNVIDIA NeMoとSuno.aiが共同開発した自動音声認識モデルで、FastConformerアーキテクチャを基に約11億のパラメータを持ち、英語音声の転写をサポートします。
音声認識 英語
P
nvidia
14.78k
29
Parakeet Rnnt 1.1b
Parakeet RNNT 1.1BはNVIDIA NeMoとSuno.aiが共同開発した自動音声認識モデルで、FastConformer Transducerアーキテクチャに基づき、約11億のパラメータを持ち、英語音声の書き起こしをサポートします。
音声認識 英語
P
nvidia
13.18k
124
Stt Fa Fastconformer Hybrid Large
これはペルシャ語の自動音声認識(ASR)向けのハイブリッドモデルで、センサーとCTCデコーダーの損失を組み合わせ、FastConformerアーキテクチャに基づいて最適化されています。
音声認識 その他
S
nvidia
2,398
9
Titu Stt Bn Fastconformer
FastConformerアーキテクチャに基づくベンガル語自動音声認識モデルで、約18K時間のトレーニングデータを使用し、高精度な音声からテキストへの変換をサポート
音声認識 その他
T
hishab
270
13
Stt En Fastconformer Transducer Xlarge
NVIDIA FastConformer-Transducerは、英語の自動音声認識(ASR)向けの高性能モデルで、最適化されたFastConformerアーキテクチャとTransducerデコーダを採用し、パラメータ規模は約6.18億です。
音声認識 英語
S
nvidia
106
24
Stt En Fastconformer Ctc Xlarge
NVIDIA FastConformer-CTC XLargeは約6億パラメータの自動音声認識(ASR)モデルで、英語音声の文字起こしのために設計され、FastConformerアーキテクチャとCTC損失でトレーニングされています。
音声認識 英語
S
nvidia
216
2
Stt En Fastconformer Ctc Large
これはFastConformerアーキテクチャに基づく大規模な自動音声認識(ASR)モデルで、英語音声をテキストに転写するために特別に設計されています。
音声認識 英語
S
nvidia
1,001
12
Stt En Fastconformer Transducer Large
これはFastConformerアーキテクチャに基づく大規模な自動音声認識(ASR)モデルで、英語音声をテキストに転写するために特別に設計されています。
音声認識 英語
S
nvidia
1,398
7
Stt Ru Fastconformer Hybrid Large Pc
これはロシア語自動音声認識のためのFastConformerハイブリッドモデルで、TransducerとCTCデコーダーを組み合わせ、パラメータ規模は約1.15億です。
音声認識 その他
S
nvidia
6,513
10
Stt Be Fastconformer Hybrid Large Pc
これはFastConformerアーキテクチャに基づく大型のベラルーシ語自動音声認識モデルで、トランスフォーマーとCTCデコーダの損失を組み合わせ、1500時間のベラルーシ語音声データで訓練されています。
音声認識 その他
S
nvidia
33
4
Stt Ua Fastconformer Hybrid Large Pc
NVIDIA FastConformer-Hybrid Large (ua) はウクライナ語の音声認識に使用される混合モデルで、TransducerとCTCの2種類の損失関数を組み合わせて訓練され、パラメータは約1億1500万です。
音声認識
S
nvidia
381
4
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase