W

Wav2vec2 Common Voice Tr Demo Dist

由 gary109 开发
该模型是基于facebook/wav2vec2-large-xlsr-53在土耳其语COMMON_VOICE数据集上微调的自动语音识别(ASR)模型,在评估集上取得了33.05%的词错误率(WER)。
下载量 26
发布时间 : 4/12/2022

模型简介

针对土耳其语优化的语音识别模型,适用于将土耳其语音频转换为文本的任务。

模型特点

土耳其语优化
专门针对土耳其语语音数据进行微调,适应土耳其语发音特点
基于wav2vec2架构
采用facebook的wav2vec2-large-xlsr-53作为基础模型,具备强大的语音特征提取能力
多GPU训练
使用2个GPU进行分布式训练,提高了训练效率

模型能力

土耳其语音频转文本
连续语音识别
语音内容转录

使用案例

语音转录
土耳其语会议记录
将土耳其语会议录音自动转换为文字记录
词错误率约33.05%
语音助手
为土耳其语语音助手提供语音识别能力
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase