W

Wav2vec2 Ksponspeech

由 Taeham 开发
基于Ksponspeech数据集微调的韩语语音识别模型,在Wav2vec2-large-xlsr-53基础上优化
下载量 111
发布时间 : 6/11/2022

模型简介

该模型是针对韩语优化的自动语音识别(ASR)模型,专门处理韩语语音转文本任务,在第三方测试集上取得0.373的词错误率(WER)

模型特点

韩语优化
专门针对韩语特性在Ksponspeech数据集上微调
高性能
在第三方测试集上达到0.373的词错误率(WER)
改进空间明确
已识别数字/字符标准化、发音校正等具体优化方向

模型能力

韩语语音识别
高准确率语音转文本
处理非标准韩语发音

使用案例

语音转录
韩语会议记录
将韩语会议录音自动转为文字记录
词错误率0.373
媒体字幕生成
为韩语视频内容自动生成字幕
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase