# 韓語語音識別

Phi 4 Multimodal Instruct Ko Asr
基於microsoft/Phi-4-multimodal-instruct微調的韓語自動語音識別(ASR)和語音翻譯(AST)模型,在zeroth-korean和fleurs數據集上表現優異。
文本生成音頻 Transformers 韓語
P
junnei
354
3
Whisper Large V3 Turbo Korean
基於zeroth韓語數據集微調的Whisper Large V3 Turbo模型,專為韓語語音識別任務優化
語音識別 TensorBoard 韓語
W
ghost613
458
6
Wav2vec2 Large Xlrs Korean V5
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-300m在zeroth_korean數據集上微調的韓語自動語音識別模型,詞錯誤率為0.2433。
語音識別 Transformers
W
student-47
285
1
Whisper Small Ko
Apache-2.0
基於Whisper Small架構的韓語語音識別模型,針對多領域韓語數據集進行了微調訓練
語音識別 Transformers 韓語
W
SungBeom
524
13
Stt Kr Conformer Ctc Medium
Apache-2.0
基於Conformer架構的韓語自動語音識別模型,針對流式處理優化,在客服語音等特定領域表現優異
語音識別 韓語
S
SungBeom
176
9
Hubert Base Korean
Apache-2.0
Hubert(Hidden-Unit BERT)是Facebook提出的一種語音表徵學習模型,採用自監督學習方式直接從原始波形信號中學習語音特徵。
語音識別 韓語
H
team-lucid
54
26
Whisper Large V2 Ko
Apache-2.0
基於OpenAI Whisper-large-v2微調的韓語自動語音識別(ASR)模型,在韓語數據集上表現出色
語音識別 Transformers 韓語
W
byoussef
94
22
Whisper Medium Ko Zeroth
Apache-2.0
基於OpenAI Whisper Medium模型在Zeroth韓語數據集上微調的語音識別模型,詞錯誤率3.64%
語音識別 Transformers 韓語
W
seastar105
154
16
Whisper Small Ko Zeroth
Apache-2.0
基於Zeroth Korean數據集微調的韓語自動語音識別模型,詞錯誤率6.76%
語音識別 Transformers 韓語
W
seastar105
285
3
Wav2vec2 Ksponspeech
Apache-2.0
基於Ksponspeech數據集微調的韓語語音識別模型,在Wav2vec2-large-xlsr-53基礎上優化
語音識別 Transformers
W
Taeham
111
4
Stt Kr Conformer Transducer Large
這是一個基於Conformer-Transducer架構的大規模韓語自動語音識別模型,在Ksponspeech數據集上訓練,適用於韓語語音轉錄任務。
語音識別 其他
S
eesungkim
129
9
Wav2vec2 Xls R 300m Korean
Apache-2.0
基於XLS-R架構的韓語自動語音識別模型,在Zeroth Korean數據集上微調
語音識別 Transformers 韓語
W
w11wo
152
6
Wav2vec2 Large Xlsr Korean
Apache-2.0
基於Wav2Vec2 XLSR架構的韓語自動語音識別(ASR)模型,在Zeroth韓語數據集上表現出色
語音識別 Transformers 韓語
W
kresnik
1.7M
44
Wav2vec2 Xlsr Korean Senior
Apache-2.0
基於wav2vec2-xlsr架構的韓語自動語音識別模型,專門針對韓國老年人語音進行優化
語音識別 Transformers 其他
W
hyyoka
26
0
Wav2vec2 Xls R 300m Korean Lm
Apache-2.0
基於XLS-R架構的韓語自動語音識別模型,在Zeroth韓語數據集上微調並添加5-gram語言模型
語音識別 Transformers 韓語
W
w11wo
23
1
Wav2vec2 Xls R 1b Korean
Apache-2.0
該模型是基於facebook/wav2vec2-xls-r-1b在KRESNIK/ZEROTH_KOREAN - CLEAN數據集上微調的韓語自動語音識別模型
語音識別 Transformers 韓語
W
anantoj
20
2
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase