# 自动语音识别

Finetuned Whisper Mr
Apache-2.0
基于simran14/mr-model-h在Common Voice 17.0马拉地语数据集上微调的Whisper小型语音识别模型
语音识别 Transformers 其他
F
simran14
38
1
Speaker Diarization Optimized
MIT
Pyannote.audio的说话人分割管道,用于自动检测音频中的说话人变化和分割语音片段
说话人处理
S
G-Root
349
0
Speaker Diarization 3.1
MIT
一个用于说话人分割的音频处理模型,能够自动检测和分割音频中的不同说话人。
说话人处理
S
pyannote
11.7M
822
Psst Fairseq Rir
Apache-2.0
该模型是基于Wav2vec 2.0基础架构微调的自动语音识别(ASR)模型,使用经过房间脉冲响应(RIR)增强的TIMIT子集训练
语音识别 Transformers 英语
P
birgermoell
30
0
Xls R Ab Test
基于xls-r-dummy在Common Voice 8.0阿布哈兹语数据集上微调的自动语音识别模型
语音识别 Transformers 其他
X
masapasa
22
1
Wav2vec2 Xls R 300m Kh
这是一个用于高棉语自动语音识别(ASR)的基线模型,旨在为高棉语语音识别任务提供基础支持。
语音识别 Transformers
W
kongkeaouch
21
0
Wynehills Mimi ASR
这是一个自动语音识别(ASR)模型,在未知数据集上训练,词错误率(WER)为0.6309。
语音识别 Transformers
W
mimi
26
0
Xls R Eng
Apache-2.0
这是一个基于wav2vec2架构的小型随机鲁棒性模型,在MOZILLA-FOUNDATION/COMMON_VOICE_7_0 - AB数据集上进行了微调,用于自动语音识别任务。
语音识别 Transformers 其他
X
mattchurgin
13
0
Xls R Demo Test
该模型是在MOZILLA-FOUNDATION/COMMON_VOICE_7_0 - AB数据集上对xls-r-dummy进行微调的自动语音识别模型
语音识别 Transformers 其他
X
chmanoj
22
0
Wav2vec2 Base Timit Fine Tuned
Apache-2.0
该模型是基于facebook/wav2vec2-base在TIMIT_ASR数据集上微调的自动语音识别(ASR)模型,在评估集上取得了0.2151的词错误率(WER)。
语音识别 Transformers
W
patrickvonplaten
21
0
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase