韩语语音识别

# 韩语语音识别

Phi 4 Multimodal Instruct Ko Asr

基于microsoft/Phi-4-multimodal-instruct微调的韩语自动语音识别(ASR)和语音翻译(AST)模型，在zeroth-korean和fleurs数据集上表现优异。

文本生成音频

Transformers 韩语

Whisper Large V3 Turbo Korean

基于zeroth韩语数据集微调的Whisper Large V3 Turbo模型，专为韩语语音识别任务优化

TensorBoard 韩语

Wav2vec2 Base Korean

基于Facebook的wav2vec2-base模型微调而来，专门针对韩语语音识别进行了优化，能够将韩语语音准确地转录为文本。

Transformers 韩语

Wav2vec2 Large Xlrs Korean V5

该模型是基于facebook/wav2vec2-xls-r-300m在zeroth_korean数据集上微调的韩语自动语音识别模型，词错误率为0.2433。

Whisper Small Ko

基于Whisper Small架构的韩语语音识别模型，针对多领域韩语数据集进行了微调训练

Transformers 韩语

Stt Kr Conformer Ctc Medium

基于Conformer架构的韩语自动语音识别模型，针对流式处理优化，在客服语音等特定领域表现优异

语音识别韩语

Hubert Large Korean

Hubert-large-korean是一个基于Hubert架构的韩语自动语音识别模型，通过自监督学习直接从语音波形中提取特征，在韩语语音处理方面表现优异。

Transformers 韩语

Hubert Base Korean

Hubert（Hidden-Unit BERT）是Facebook提出的一种语音表征学习模型，采用自监督学习方式直接从原始波形信号中学习语音特征。

语音识别韩语

Whisper Large V2 Ko

基于OpenAI Whisper-large-v2微调的韩语自动语音识别(ASR)模型，在韩语数据集上表现出色

Transformers 韩语

Whisper Medium Ko Zeroth

基于OpenAI Whisper Medium模型在Zeroth韩语数据集上微调的语音识别模型，词错误率3.64%

Transformers 韩语

Whisper Small Ko Zeroth

基于Zeroth Korean数据集微调的韩语自动语音识别模型，词错误率6.76%

Transformers 韩语

Wav2vec2 Ksponspeech

基于Ksponspeech数据集微调的韩语语音识别模型，在Wav2vec2-large-xlsr-53基础上优化

Stt Kr Conformer Transducer Large

这是一个基于Conformer-Transducer架构的大规模韩语自动语音识别模型，在Ksponspeech数据集上训练，适用于韩语语音转录任务。

语音识别其他

Wav2vec2 Xls R 300m Korean

基于XLS-R架构的韩语自动语音识别模型，在Zeroth Korean数据集上微调

Transformers 韩语

Wav2vec2 Large Xlsr Korean

基于Wav2Vec2 XLSR架构的韩语自动语音识别(ASR)模型，在Zeroth韩语数据集上表现出色

Transformers 韩语

Wav2vec2 Xls R 1b Korean

该模型是基于facebook/wav2vec2-xls-r-1b在KRESNIK/ZEROTH_KOREAN - CLEAN数据集上微调的韩语自动语音识别模型

Transformers 韩语

Wav2vec2 Xls R 300m Korean Lm

基于XLS-R架构的韩语自动语音识别模型，在Zeroth韩语数据集上微调并添加5-gram语言模型

Transformers 韩语

Wav2vec2 Xlsr Korean Senior

基于wav2vec2-xlsr架构的韩语自动语音识别模型，专门针对韩国老年人语音进行优化

Transformers 其他

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase