# 音声認識最適化

Whisper Large V3 Turbo Es
MIT
Whisper-large-v3-turboをファインチューニングしたスペイン語音声認識モデル。Common Voice 17.0スペイン語データセットで単語誤り率を5.34%まで低減
音声認識 Transformers スペイン語
W
adriszmar
52
4
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V4
Apache-2.0
このモデルは、gary109/ai-light-dance_stepmania_ft_wav2vec2-large-xlsr-53-v3を基に、GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2データセットで微調整された自動音声認識モデルです。
音声認識 Transformers
A
gary109
189
0
Wav2vec2 Base Timit Demo Google Colab
Apache-2.0
facebook/wav2vec2-baseモデルをTIMITデータセットでファインチューニングした音声認識モデルで、英語音声からテキストへの変換タスクに適しています。
音声認識 Transformers
W
atgarcia
19
0
Wav2vec2 Large 960h Lv60 Self MIDIARIES 72H FT
Facebookが事前学習したwav2vec2 large 960H lv60自己教師ありモデルを基に、72時間のMI日記データで微調整した音声認識モデル
音声認識 Transformers
W
caurdy
20
0
Pyctcdecode Asr
pyctcdecodeライブラリとHugging Faceモデルを組み合わせた自動音声認識(ASR)ソリューションで、効率的なデコード能力を提供
音声認識
P
osanseviero
16
1
Wav2vec2 Large Lv60h 100h 2nd Try
LibriSpeechデータセットで微調整されたwav2vec2-large-lv60音声認識モデル、英語音声からテキストへの変換タスクをサポート
音声認識 Transformers
W
patrickvonplaten
20
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase