# 英語音声文字起こし

Parakeet Tdt 1.1b
Parakeet TDT 1.1BはNVIDIA NeMoとSuno.aiが共同開発した自動音声認識(ASR)モデルで、音声を小文字の英字に文字起こしできます。
音声認識 英語
P
nvidia
12.27k
90
Stt En Fastconformer Ctc Large
これはFastConformerアーキテクチャに基づく大規模な自動音声認識(ASR)モデルで、英語音声をテキストに転写するために特別に設計されています。
音声認識 英語
S
nvidia
1,001
12
Assignment1 Jack
MIT
自動音声認識(ASR)のための音声からテキストへの変換(S2T)モデルで、シーケンス・ツー・シーケンス変換アーキテクチャに基づいています
音声認識 Transformers 英語
A
Classroom-workshop
24
0
Wav2vec2 Large 960h Lv60 Self With Wikipedia Lm
Facebookのwav2vec2-large-960h-lv60-selfモデルを基に、ウィキペディア言語モデルで強化した自動音声認識(ASR)システム
音声認識 Transformers
W
gxbag
15
2
Asr Crdnn Rnnlm Librispeech
Apache-2.0
これはLibriSpeechデータセットで事前訓練されたエンドツーエンドの自動音声認識システムで、CRDNNアーキテクチャとCTC/注意機構およびRNN言語モデルを組み合わせており、英語音声認識タスクで優れた性能を発揮します。
音声認識 英語
A
speechbrain
1,354
10
S2t Small Librispeech Asr
MIT
自動音声認識(ASR)のための音声からテキストへの変換(S2T)モデルで、シーケンス・ツー・シーケンス変換アーキテクチャに基づいています
音声認識 Transformers 英語
S
facebook
10.92k
27
Wavlm Libri Clean 100h Base
microsoft/wavlm-baseをLIBRISPEECH_ASR - CLEANデータセットでファインチューニングした自動音声認識モデル
音声認識 Transformers
W
patrickvonplaten
6,515
1
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase