L

Lyric Alignment

由 nguyenvulebinh 开发
基于wav2vec2的越南语歌词时间轴对齐模型,用于将歌词与音乐音频精确对齐
下载量 37
发布时间 : 11/22/2022

模型简介

该模型主要用于将越南语歌曲的歌词与音频时间轴精确对齐,支持卡拉OK风格的歌词同步显示。模型基于CTC-Segmentation算法和wav2vec2架构实现。

模型特点

高精度对齐
使用CTC-Segmentation算法实现精确的歌词-音频时间轴对齐
多语言处理
能够处理越南语和英语混合的歌词内容
大规模训练数据
基于1,500小时的越南语歌曲数据进行训练
特殊字符处理
能够处理特殊字符、数字格式和昵称等非标准歌词内容

模型能力

语音识别
歌词时间轴对齐
英语-越南语混合处理
特殊字符转换

使用案例

音乐应用
卡拉OK歌词同步
为音乐播放器提供精确的歌词时间轴信息
在Zalo AI挑战赛2022中达到IoU=0.632的准确率
音乐教育
帮助学习者准确掌握歌曲发音和节奏
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase