# 英語音声

Wav2vec2 Base Timit Demo Colab70
Apache-2.0
このモデルはfacebook/wav2vec2-baseをTIMITデータセットでファインチューニングした音声認識モデルで、主に英語音声からテキストへの変換タスクに使用されます。
音声認識 Transformers
W
hassnain
15
0
Wav2vec2 Base Timit Demo Colab11
Apache-2.0
facebook/wav2vec2-baseモデルをTIMITデータセットでファインチューニングした音声認識モデル
音声認識 Transformers
W
hassnain
18
0
Wav2vec2 Base Timit Demo Colab4
Apache-2.0
facebook/wav2vec2-baseモデルをTIMITデータセットでファインチューニングした音声認識モデル
音声認識 Transformers
W
sameearif88
16
0
Wav2vec2 Base Timit Demo Colab0
Apache-2.0
facebook/wav2vec2-baseモデルをTIMITデータセットでファインチューニングした音声認識モデル
音声認識 Transformers
W
cuzeverynameistaken
20
0
Wav2vec2 Base Timit Demo Colab1
Apache-2.0
facebook/wav2vec2-baseをベースにファインチューニングした音声認識モデルで、TIMITデータセットでトレーニング済み
音声認識 Transformers
W
sameearif88
25
0
Wavlm Base
WavLMはマイクロソフトが開発した大規模な自己教師付き事前学習音声モデルで、16kHzサンプリングの音声オーディオを基に事前学習され、フルスタック音声処理タスクに適しています。
音声認識 Transformers 英語
W
microsoft
28.33k
7
Wsj0 Full Supervised
Apache-2.0
このモデルは、facebook/wav2vec2-large-lv60をWSJ0データセットで微調整した音声認識モデルで、評価セットで0.0343の単語誤り率を達成しました。
音声認識 Transformers
W
Kuray107
26
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase