O

Openjmla

由 UniMus 开发
OpenJMLA 是一个零样本音乐标签系统,通过联合音乐和语言注意力模型解决开放集音乐标签问题。
下载量 116
发布时间 : 12/5/2023

模型简介

OpenJMLA 旨在解决开放集音乐标签问题,通过联合音乐和语言注意力(JMLA)模型实现零样本音乐标签系统,在相关数据集上取得了优异的成绩。

模型特点

开放集音乐标签
解决了传统封闭集音乐标签无法推广到新标签的问题。
创新的模型架构
结合音频编码器和语言解码器,引入预感知器重采样器和密集注意力连接。
大规模数据集
使用互联网收集的音乐和描述数据,并通过 ChatGPT 进行形式化和多样化处理。
优异的性能
在 GTZAN 数据集上实现了 64.82% 的零样本音频标签准确率。

模型能力

音乐标签生成
音乐描述生成
零样本学习

使用案例

音乐分类
流派识别
识别音乐的流派,如流行、摇滚等。
在 GTZAN 数据集上准确率 64.82%
情绪分析
分析音乐的情绪,如忧郁、快乐等。
音乐推荐
场景匹配
根据音乐标签推荐适合的场景,如酒吧、运动等。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase