# LibriSpeechファインチューニング

Wav2vec2 Base Librispeech Demo Colab
Apache-2.0
このモデルはfacebook/wav2vec2-baseをLibriSpeechデータセットでファインチューニングした音声認識モデルで、評価セットで0.3174の単語誤り率を達成しました。
音声認識 Transformers
W
vishwasgautam
14
0
Hubert Base Librispeech Demo Colab
Apache-2.0
facebook/hubert-large-ls960-ftをファインチューニングした音声認識モデルで、LibriSpeechデータセットでトレーニング済み
音声認識 Transformers
H
vishwasgautam
101
0
F5 Ita Test
これはF5-TTSモデルのイタリア語ファインチューニング版で、facebook/multilingual_librispeechデータセットでトレーニングされ、イタリア語のテキスト読み上げタスクに特化しています。
音声合成 その他
F
alien79
98
2
Speecht5 Finetuned Multilingual Librispeech De
MIT
Microsoft SpeechT5モデルをドイツ語LibriSpeechデータセットでファインチューニングしたテキストから音声へのモデル
音声合成 Transformers ドイツ語
S
semaj83
14
0
Librispeech 100h Supervised Meta
Apache-2.0
Kuray107/librispeech-5h-supervisedをファインチューニングした音声認識モデルで、100時間のLibriSpeechデータセットでトレーニング
音声認識 Transformers
L
Kuray107
25
0
Data2vec Audio Large 960h
Apache-2.0
Data2Vecは音声、視覚、言語タスクに適用可能な汎用自己教師あり学習フレームワークです。この音声大規模モデルはLibriSpeechの960時間音声データで事前学習とファインチューニングされ、自動音声認識タスク向けに最適化されています。
音声認識 Transformers 英語
D
facebook
2,531
7
Unispeech Sat Base 100h Libri Ft
Apache-2.0
UniSpeech-SAT基本モデルを基に、LibriSpeech音声データで100時間のファインチューニングを行った自動音声認識モデル
音声認識 Transformers 英語
U
microsoft
643
4
Wavlm Base Libri Clean 100
WavLMアーキテクチャに基づく自動音声認識モデルで、LibriSpeech CLEANデータセット(100時間)でファインチューニング済み
音声認識 Transformers
W
anjulRajendraSharma
73
0
Wav2vec2 100m Mls German Ft
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-100mを多言語LibriSpeechドイツ語データセットでファインチューニングした自動音声認識モデルです
音声認識 Transformers
W
patrickvonplaten
27
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase