# Librispeech微調

Wav2vec2 Large Xlsr 53 Gender Recognition Librispeech
Apache-2.0
基於Librispeech-clean-100數據集微調的性別識別模型,在測試集上F1分數達0.9993
音頻分類 Transformers
W
alefiury
182.33k
42
Wav2vec2 Conformer Rope Large 100h Ft
Apache-2.0
基於Librispeech 100小時語音數據微調的Wav2Vec2 Conformer模型,採用旋轉位置嵌入技術
語音識別 Transformers 英語
W
facebook
99
0
Wav2vec2 Conformer Rel Pos Large 100h Ft
Apache-2.0
採用相對位置嵌入技術的Wav2Vec2-Conformer大型語音識別模型,基於Librispeech 100小時語音數據微調
語音識別 Transformers 英語
W
facebook
99
0
Data2vec Audio Large 100h
Apache-2.0
Data2Vec是一個通用的自監督學習框架,適用於語音、自然語言處理和計算機視覺任務。該模型是基於Librispeech語音音頻進行100小時預訓練和微調的大模型。
語音識別 Transformers 英語
D
facebook
46
2
Data2vec Audio Large 10m
Apache-2.0
Data2Vec是一個通用的自監督學習框架,適用於語音、視覺和語言任務。該音頻大模型基於Librispeech的10分鐘數據進行預訓練和微調,適用於16kHz採樣的語音音頻。
語音識別 Transformers 英語
D
facebook
19
0
Wav2vec2 2 Bart Base
基於wav2vec2-base和bart-base在LibriSpeech ASR clean數據集上微調的語音識別模型
語音識別 Transformers
W
patrickvonplaten
493
5
Data2vec Audio Base 100h
Apache-2.0
Data2Vec是一個通用的自監督學習框架,適用於語音、視覺和語言任務。該音頻基礎模型基於Librispeech語音音頻進行了100小時的預訓練和微調。
語音識別 Transformers 英語
D
facebook
4,369
1
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase