# エンドツーエンド音声認識

Fsmn Vad
その他
FunASRは音声認識の学術研究と産業応用を結びつける基本ツールキットで、音声認識、音声活動検出、句読点回復など多機能をサポートします。
音声認識
F
funasr
107
17
Assignment1 Francesco
MIT
音声からテキストへの変換器(S2T)で訓練された自動音声認識(ASR)モデルで、英語音声認識向けに設計されています
音声認識 Transformers 英語
A
Classroom-workshop
22
0
Assignment1 Maria
MIT
s2t-small-librispeech-asr は自動音声認識(ASR)のための音声からテキストへの変換(S2T)モデルで、シーケンス・ツー・シーケンスのトランスフォーマーアーキテクチャに基づいています。
音声認識 Transformers 英語
A
Classroom-workshop
23
0
Assignment1 Joane
MIT
自動音声認識(ASR)のための音声からテキストへの変換(S2T)モデル
音声認識 Transformers 英語
A
Classroom-workshop
22
0
Assignment1 Jack
MIT
自動音声認識(ASR)のための音声からテキストへの変換(S2T)モデルで、シーケンス・ツー・シーケンス変換アーキテクチャに基づいています
音声認識 Transformers 英語
A
Classroom-workshop
24
0
Assignment1 Jane
MIT
s2t-small-librispeech-asr は、自動音声認識(ASR)のための音声からテキストへの変換器(S2T)モデルで、シーケンス・ツー・シーケンス変換器アーキテクチャに基づいています。
音声認識 Transformers 英語
A
Classroom-workshop
29
0
Wav2vec2 Marathi Stt
これはWav2Vec2アーキテクチャに基づくマラーティー語(Marathi)音声認識モデルで、音声を直接テキストに変換できます。
音声認識 Transformers
W
addy88
30
0
Kamo Naoyuki Mini An4 Asr Train Raw Bpe Valid.acc.best
これはESPnet2フレームワークでトレーニングされた自動音声認識(ASR)事前学習モデルで、mini-an4データセットを使用してトレーニングされ、英語音声認識をサポートします。
音声認識 英語
K
espnet
425
1
Wav2vec2 Base Turkish Cv8
これはCommon Voice 8.0トルコ語データセットを基に微調整された自動音声認識(ASR)モデルで、トルコ語の音声をテキストに変換することができます。
音声認識 Transformers その他
W
cahya
16
1
S2t Medium Librispeech Asr
MIT
シーケンスツーシーケンストランスフォーマーアーキテクチャに基づく、自動音声認識(ASR)用の音声からテキストへの変換器(S2T)モデル
音声認識 Transformers 英語
S
facebook
1,086
9
S2t Small Librispeech Asr
MIT
自動音声認識(ASR)のための音声からテキストへの変換(S2T)モデルで、シーケンス・ツー・シーケンス変換アーキテクチャに基づいています
音声認識 Transformers 英語
S
facebook
10.92k
27
Asr Wav2vec2 Commonvoice Rw
Apache-2.0
これはルワンダ語の自動音声認識のためのエンドツーエンドモデルで、wav2vec 2.0事前トレーニングモデルとCTCおよびアテンションメカニズムを組み合わせ、CommonVoiceデータセットでファインチューニングされています。
音声認識 その他
A
speechbrain
28
1
S2t Large Librispeech Asr
MIT
LibriSpeechデータセットでトレーニングされた自動音声認識(ASR)のためのエンドツーエンドシーケンス・ツー・シーケンストランスフォーマーモデル
音声認識 Transformers 英語
S
facebook
422
10
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase