L

Lyric Alignment

Developed by nguyenvulebinh
基于wav2vec2的越南语歌词时间轴对齐模型,用于将歌词与音乐音频精确对齐
Downloads 37
Release Time : 11/22/2022

Model Overview

该模型主要用于将越南语歌曲的歌词与音频时间轴精确对齐,支持卡拉OK风格的歌词同步显示。模型基于CTC-Segmentation算法和wav2vec2架构实现。

Model Features

高精度对齐
使用CTC-Segmentation算法实现精确的歌词-音频时间轴对齐
多语言处理
能够处理越南语和英语混合的歌词内容
大规模训练数据
基于1,500小时的越南语歌曲数据进行训练
特殊字符处理
能够处理特殊字符、数字格式和昵称等非标准歌词内容

Model Capabilities

语音识别
歌词时间轴对齐
英语-越南语混合处理
特殊字符转换

Use Cases

音乐应用
卡拉OK歌词同步
为音乐播放器提供精确的歌词时间轴信息
在Zalo AI挑战赛2022中达到IoU=0.632的准确率
音乐教育
帮助学习者准确掌握歌曲发音和节奏
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase