# 韩语语音识别

Phi 4 Multimodal Instruct Ko Asr
基于microsoft/Phi-4-multimodal-instruct微调的韩语自动语音识别(ASR)和语音翻译(AST)模型,在zeroth-korean和fleurs数据集上表现优异。
文本生成音频 Transformers 韩语
P
junnei
354
3
Whisper Large V3 Turbo Korean
基于zeroth韩语数据集微调的Whisper Large V3 Turbo模型,专为韩语语音识别任务优化
语音识别 TensorBoard 韩语
W
ghost613
458
6
Wav2vec2 Base Korean
基于Facebook的wav2vec2-base模型微调而来,专门针对韩语语音识别进行了优化,能够将韩语语音准确地转录为文本。
语音识别 Transformers 韩语
W
Kkonjeong
448
1
Wav2vec2 Large Xlrs Korean V5
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-300m在zeroth_korean数据集上微调的韩语自动语音识别模型,词错误率为0.2433。
语音识别 Transformers
W
student-47
285
1
Whisper Small Ko
Apache-2.0
基于Whisper Small架构的韩语语音识别模型,针对多领域韩语数据集进行了微调训练
语音识别 Transformers 韩语
W
SungBeom
524
13
Stt Kr Conformer Ctc Medium
Apache-2.0
基于Conformer架构的韩语自动语音识别模型,针对流式处理优化,在客服语音等特定领域表现优异
语音识别 韩语
S
SungBeom
176
9
Hubert Large Korean
Apache-2.0
Hubert-large-korean是一个基于Hubert架构的韩语自动语音识别模型,通过自监督学习直接从语音波形中提取特征,在韩语语音处理方面表现优异。
语音识别 Transformers 韩语
H
team-lucid
131
11
Hubert Base Korean
Apache-2.0
Hubert(Hidden-Unit BERT)是Facebook提出的一种语音表征学习模型,采用自监督学习方式直接从原始波形信号中学习语音特征。
语音识别 韩语
H
team-lucid
54
26
Whisper Large V2 Ko
Apache-2.0
基于OpenAI Whisper-large-v2微调的韩语自动语音识别(ASR)模型,在韩语数据集上表现出色
语音识别 Transformers 韩语
W
byoussef
94
22
Whisper Medium Ko Zeroth
Apache-2.0
基于OpenAI Whisper Medium模型在Zeroth韩语数据集上微调的语音识别模型,词错误率3.64%
语音识别 Transformers 韩语
W
seastar105
154
16
Whisper Small Ko Zeroth
Apache-2.0
基于Zeroth Korean数据集微调的韩语自动语音识别模型,词错误率6.76%
语音识别 Transformers 韩语
W
seastar105
285
3
Wav2vec2 Ksponspeech
Apache-2.0
基于Ksponspeech数据集微调的韩语语音识别模型,在Wav2vec2-large-xlsr-53基础上优化
语音识别 Transformers
W
Taeham
111
4
Stt Kr Conformer Transducer Large
这是一个基于Conformer-Transducer架构的大规模韩语自动语音识别模型,在Ksponspeech数据集上训练,适用于韩语语音转录任务。
语音识别 其他
S
eesungkim
129
9
Wav2vec2 Xls R 300m Korean
Apache-2.0
基于XLS-R架构的韩语自动语音识别模型,在Zeroth Korean数据集上微调
语音识别 Transformers 韩语
W
w11wo
152
6
Wav2vec2 Large Xlsr Korean
Apache-2.0
基于Wav2Vec2 XLSR架构的韩语自动语音识别(ASR)模型,在Zeroth韩语数据集上表现出色
语音识别 Transformers 韩语
W
kresnik
1.7M
44
Wav2vec2 Xls R 1b Korean
Apache-2.0
该模型是基于facebook/wav2vec2-xls-r-1b在KRESNIK/ZEROTH_KOREAN - CLEAN数据集上微调的韩语自动语音识别模型
语音识别 Transformers 韩语
W
anantoj
20
2
Wav2vec2 Xls R 300m Korean Lm
Apache-2.0
基于XLS-R架构的韩语自动语音识别模型,在Zeroth韩语数据集上微调并添加5-gram语言模型
语音识别 Transformers 韩语
W
w11wo
23
1
Wav2vec2 Xlsr Korean Senior
Apache-2.0
基于wav2vec2-xlsr架构的韩语自动语音识别模型,专门针对韩国老年人语音进行优化
语音识别 Transformers 其他
W
hyyoka
26
0
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase