# 語音識別微調

Wav2vec2 Large Xlsr 53 English Pronunciation Evaluation Aod Cut Balance
Apache-2.0
基於wav2vec2-large-xlsr-53的英語發音評估模型,用於評估英語發音質量
音頻分類 Transformers
W
hafidikhsan
35
5
Audio Classification Model
Apache-2.0
基於facebook/wav2vec2-base-960h微調的音頻分類模型,具體用途和訓練數據未明確說明。
音頻分類 Transformers
A
SinghManish
19
1
Neunit Ks
Apache-2.0
基於facebook/wav2vec2-base微調的語音處理模型,準確率為28.57%
語音識別 Transformers
N
SHENMU007
23
0
Wav2vec2 Nsc Final 2 Google Colab
Apache-2.0
基於facebook/wav2vec2-base微調的語音處理模型,具體用途未明確說明
語音識別 Transformers
W
YuanWellspring
14
0
Wav2vec2 Base Librispeech Demo Colab
Apache-2.0
該模型是基於facebook/wav2vec2-base在LibriSpeech數據集上微調的語音識別模型,適用於英語語音轉文本任務。
語音識別 Transformers
W
khanhnguyen
24
0
Wav2vec2 Custom Model 50
Apache-2.0
基於facebook/wav2vec2-large-960h-lv60-self微調的語音識別模型
語音識別 Transformers
W
PrajwalS
22
0
Wav2vec2 Base Timit Demo Colab240
Apache-2.0
基於facebook/wav2vec2-base模型微調的語音識別模型,在TIMIT數據集上進行了訓練
語音識別 Transformers
W
hassnain
16
0
Part1
Apache-2.0
該模型是基於facebook/wav2vec2-base微調的語音處理模型,具體用途未明確說明
語音識別 Transformers
P
zasheza
28
0
Wav2vec2 Base Toy Train Data Random Low Pass
Apache-2.0
該模型是基於facebook/wav2vec2-base在未知數據集上微調的語音識別模型,主要用於自動語音識別(ASR)任務。
語音識別 Transformers
W
scasutt
29
0
Wav2vec2 Large Xlsr 53 Toy Train Data Masked Audio 10ms
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53微調的語音識別模型,在10ms音頻掩碼訓練數據上優化
語音識別 Transformers
W
scasutt
22
0
Wav2vec2 Base Toy Train Data Masked Audio 10ms
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在10ms音頻掩碼任務上訓練
語音識別 Transformers
W
scasutt
22
0
Wav2vec2 Base Toy Train Data Augment 0.1
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,在玩具數據集上訓練並應用了0.1比例的數據增強
語音識別 Transformers
W
scasutt
22
0
Wav2vec2 Large Xlsr 53 Toy Train Data Augment 0.1.csv
Apache-2.0
該模型是基於facebook/wav2vec2-base微調的語音識別模型,使用數據增強技術訓練
語音識別 Transformers
W
scasutt
22
0
Wav2vec2 Base Toy Train Data Augment 0.1.csv
Apache-2.0
該模型是基於facebook/wav2vec2-base進行微調的語音識別模型,使用了數據增強技術(增強比例為0.1)。
語音識別 Transformers
W
scasutt
21
0
Wav2vec2 Model1 Torgo
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型
語音識別 Transformers
W
modhp
20
0
Sew D Small 100k Timit
Apache-2.0
該模型是基於asapp/sew-d-small-100k在TIMIT_ASR - NA數據集上微調的自動語音識別模型,在評估集上取得了0.8061的詞錯誤率。
語音識別 Transformers
S
patrickvonplaten
16
0
Sew D Small 100k Ft Timit
Apache-2.0
基於asapp/sew-d-small-100k在TIMIT_ASR數據集上微調的自動語音識別模型
語音識別 Transformers
S
patrickvonplaten
18
0
Alphadelay
Apache-2.0
基於facebook/wav2vec2-base微調的語音識別模型,詞錯誤率(WER)為1.0
語音識別 Transformers
A
renBaikau
17
0
Sat Base
基於microsoft/unispeech-sat-base在TIMIT_ASR數據集上微調的自動語音識別模型
語音識別 Transformers
S
patrickvonplaten
22
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase