H

HIYACCENT Wav2Vec2

由 codeceejay 开发
HIYACCENT是一个针对尼日利亚英语口音优化的语音识别系统,基于Wav2Vec2架构改进,识别性能提升超过20%。
下载量 27
发布时间 : 3/2/2022

模型简介

该模型通过在Facebook Wav2vec架构上新增网络层来捕捉基线模型与尼日利亚英语语音的差异,并在模型顶层加入CTC损失函数以增强语音-文本对齐的灵活性,专门为受母语发音影响严重的尼日利亚英语使用者开发。

模型特点

尼日利亚口音优化
专门针对尼日利亚英语使用者的发音特点进行优化,识别性能提升超过20%。
改进的Wav2Vec2架构
在标准Wav2vec架构上新增网络层,更好地捕捉尼日利亚英语与标准英语的发音差异。
CTC损失函数
在模型顶层加入CTC损失函数,增强语音-文本对齐的灵活性。

模型能力

尼日利亚口音英语语音识别
16kHz采样率语音处理

使用案例

语音转写
尼日利亚英语语音转录
将尼日利亚英语使用者的语音准确转录为文本
相比标准模型性能提升20%以上
语音助手
尼日利亚口音语音交互
为尼日利亚用户提供更准确的语音助手交互体验
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase