# 语音识别微调

Wav2vec2 Large Xlsr 53 English Pronunciation Evaluation Aod Cut Balance
Apache-2.0
基于wav2vec2-large-xlsr-53的英语发音评估模型,用于评估英语发音质量
音频分类 Transformers
W
hafidikhsan
35
5
Audio Classification Model
Apache-2.0
基于facebook/wav2vec2-base-960h微调的音频分类模型,具体用途和训练数据未明确说明。
音频分类 Transformers
A
SinghManish
19
1
Neunit Ks
Apache-2.0
基于facebook/wav2vec2-base微调的语音处理模型,准确率为28.57%
语音识别 Transformers
N
SHENMU007
23
0
Wav2vec2 Nsc Final 2 Google Colab
Apache-2.0
基于facebook/wav2vec2-base微调的语音处理模型,具体用途未明确说明
语音识别 Transformers
W
YuanWellspring
14
0
Wav2vec2 Base Librispeech Demo Colab
Apache-2.0
该模型是基于facebook/wav2vec2-base在LibriSpeech数据集上微调的语音识别模型,适用于英语语音转文本任务。
语音识别 Transformers
W
khanhnguyen
24
0
Wav2vec2 Custom Model 50
Apache-2.0
基于facebook/wav2vec2-large-960h-lv60-self微调的语音识别模型
语音识别 Transformers
W
PrajwalS
22
0
Wav2vec2 Base Timit Demo Colab240
Apache-2.0
基于facebook/wav2vec2-base模型微调的语音识别模型,在TIMIT数据集上进行了训练
语音识别 Transformers
W
hassnain
16
0
Part1
Apache-2.0
该模型是基于facebook/wav2vec2-base微调的语音处理模型,具体用途未明确说明
语音识别 Transformers
P
zasheza
28
0
Wav2vec2 Base Toy Train Data Random Low Pass
Apache-2.0
该模型是基于facebook/wav2vec2-base在未知数据集上微调的语音识别模型,主要用于自动语音识别(ASR)任务。
语音识别 Transformers
W
scasutt
29
0
Wav2vec2 Large Xlsr 53 Toy Train Data Masked Audio 10ms
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53微调的语音识别模型,在10ms音频掩码训练数据上优化
语音识别 Transformers
W
scasutt
22
0
Wav2vec2 Base Toy Train Data Masked Audio 10ms
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,在10ms音频掩码任务上训练
语音识别 Transformers
W
scasutt
22
0
Wav2vec2 Base Toy Train Data Augment 0.1
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,在玩具数据集上训练并应用了0.1比例的数据增强
语音识别 Transformers
W
scasutt
22
0
Wav2vec2 Large Xlsr 53 Toy Train Data Augment 0.1.csv
Apache-2.0
该模型是基于facebook/wav2vec2-base微调的语音识别模型,使用数据增强技术训练
语音识别 Transformers
W
scasutt
22
0
Wav2vec2 Base Toy Train Data Augment 0.1.csv
Apache-2.0
该模型是基于facebook/wav2vec2-base进行微调的语音识别模型,使用了数据增强技术(增强比例为0.1)。
语音识别 Transformers
W
scasutt
21
0
Wav2vec2 Model1 Torgo
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型
语音识别 Transformers
W
modhp
20
0
Alphadelay
Apache-2.0
基于facebook/wav2vec2-base微调的语音识别模型,词错误率(WER)为1.0
语音识别 Transformers
A
renBaikau
17
0
Sew D Small 100k Ft Timit
Apache-2.0
基于asapp/sew-d-small-100k在TIMIT_ASR数据集上微调的自动语音识别模型
语音识别 Transformers
S
patrickvonplaten
18
0
Sew D Small 100k Timit
Apache-2.0
该模型是基于asapp/sew-d-small-100k在TIMIT_ASR - NA数据集上微调的自动语音识别模型,在评估集上取得了0.8061的词错误率。
语音识别 Transformers
S
patrickvonplaten
16
0
Sat Base
基于microsoft/unispeech-sat-base在TIMIT_ASR数据集上微调的自动语音识别模型
语音识别 Transformers
S
patrickvonplaten
22
0
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase