# Conformerアーキテクチャ

Asr Conformer Largescaleasr
Apache-2.0
これはSpeechBrainフレームワークでトレーニングされたエンドツーエンドの自動音声認識システムで、Conformerアーキテクチャを使用して25,000時間の英語音声データでトレーニングされています。
音声認識 英語
A
speechbrain
92
12
Indicconformer Stt Ur Hybrid Ctc Rnnt Large
MIT
IndicConformerは、混合CTC-RNNTアーキテクチャに基づくConformer自動音声認識モデルで、ウルドゥー語音声の書き起こしに特化しています。
音声認識 その他
I
ai4bharat
44
2
Indicconformer Stt Ne Hybrid Ctc Rnnt Large
MIT
IndicConformerは、混合CTC-RNNTアーキテクチャに基づくConformer自動音声認識モデルで、ネパール語に特化して最適化されています
音声認識 その他
I
ai4bharat
36
2
Indicconformer Stt Hi Hybrid Ctc Rnnt Large
MIT
IndicConformerは、混合CTC-RNNTアーキテクチャに基づくConformer自動音声認識(ASR)モデルで、ヒンディー語音声の文字起こしをサポートします。
音声認識 その他
I
ai4bharat
1,694
3
W2v Bert 2.0
MIT
Conformerアーキテクチャに基づく音声エンコーダーで、450万時間のラベルなし音声データで事前学習され、143以上の言語をサポート
音声認識 Transformers 複数言語対応
W
facebook
477.05k
170
Fastspeech2 Conformer With Hifigan
Apache-2.0
FastSpeech2ConformerとHiFi-GANを統合したテキスト音声合成モデルで、効率的で高品質な音声合成を提供
音声合成 Transformers 英語
F
espnet
635
0
Fastspeech2 Conformer
Apache-2.0
FastSpeech2Conformerは非自己回帰型のテキスト音声合成(TTS)モデルで、FastSpeech2とConformerアーキテクチャの利点を組み合わせ、テキストから高品質な音声を迅速かつ効率的に生成できます。
音声合成 Transformers 英語
F
espnet
2,440
6
Stt Rw Conformer Transducer Large
これはルワンダ語の音声認識に使用されるConformer-Transducerの大型モデルで、音声を小文字のラテン文字に文字起こしでき、空白とアポストロフィをサポートします。
音声認識 その他
S
nvidia
116
1
Stt Fr Conformer Transducer Large
これはフランス語自動音声認識のための大規模なConformer-トランスデューサーモデルで、約1.2億のパラメータを持ち、1500時間以上のフランス語音声データでトレーニングされています。
音声認識 フランス語
S
nvidia
31
10
Stt Zh Conformer Transducer Large
これは標準中国語音声を転写するための大規模なConformer-Transducerモデルで、約1.2億のパラメータを持ち、AISHELL-2データセットでトレーニングされました。
音声認識 中国語
S
nvidia
72
13
Stt Fr Conformer Ctc Large
これはConformerアーキテクチャに基づくフランス語自動音声認識(ASR)の大規模モデルで、CTC損失関数を使用し、1500時間以上のフランス語音声データでトレーニングされています。
音声認識 フランス語
S
nvidia
361
6
Stt De Conformer Transducer Large
これはドイツ語の自動音声認識用の大規模なConformer-Transducerモデルで、約1.2億のパラメータを持ち、ドイツ語音声をテキストに変換します。
音声認識 ドイツ語
S
nvidia
66
6
Stt En Conformer Transducer Xlarge
これはNVIDIAが開発した自動音声認識(ASR)モデルで、Conformer-Transducerアーキテクチャに基づき、約6億のパラメータを持ち、英語音声の転写専用に設計されています。
音声認識 英語
S
nvidia
496
54
Stt Kr Conformer Transducer Large
これはConformer-Transducerアーキテクチャに基づく大規模な韓国語自動音声認識モデルで、Ksponspeechデータセットでトレーニングされ、韓国語音声の文字起こしタスクに適しています。
音声認識 その他
S
eesungkim
129
9
Wav2vec2 Conformer Rope Large 100h Ft
Apache-2.0
Librispeech 100時間の音声データでファインチューニングされたWav2Vec2 Conformerモデルで、回転位置埋め込み技術を採用
音声認識 Transformers 英語
W
facebook
99
0
Wav2vec2 Conformer Rel Pos Large 100h Ft
Apache-2.0
相対位置埋め込み技術を採用したWav2Vec2-Conformer大型音声認識モデル、Librispeech 100時間音声データで微調整
音声認識 Transformers 英語
W
facebook
99
0
Simpleoier Librispeech Asr Train Asr Conformer7 Wavlm Large Raw En Bpe5000 Sp
ESPnetフレームワークでトレーニングされた自動音声認識(ASR)モデルで、ConformerアーキテクチャとWavLM大型事前学習モデルを使用し、LibriSpeechデータセットでトレーニングされました。
音声認識 英語
S
espnet
66
1
Kan Bayashi Ljspeech Joint Finetune Conformer Fastspeech2 Hifigan
これはESPnet2に基づくテキスト音声変換(TTS)モデルで、LJSpeechデータセットを使用して訓練され、Conformer、FastSpeech2、HiFi - GANアーキテクチャを組み合わせています。
音声合成 英語
K
espnet
20
16
Kan Bayashi Vctk Xvector Conformer Fastspeech2
ESPnetフレームワークに基づいて訓練されたテキスト音声変換モデルで、VCTKデータセットを使用し、多話者音声合成をサポートします。
音声合成 英語
K
espnet
15
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase