O

Openjmla

由UniMus開發
OpenJMLA 是一個零樣本音樂標籤系統,通過聯合音樂和語言注意力模型解決開放集音樂標籤問題。
下載量 116
發布時間 : 12/5/2023

模型概述

OpenJMLA 旨在解決開放集音樂標籤問題,通過聯合音樂和語言注意力(JMLA)模型實現零樣本音樂標籤系統,在相關數據集上取得了優異的成績。

模型特點

開放集音樂標籤
解決了傳統封閉集音樂標籤無法推廣到新標籤的問題。
創新的模型架構
結合音頻編碼器和語言解碼器,引入預感知器重採樣器和密集註意力連接。
大規模數據集
使用互聯網收集的音樂和描述數據,並通過 ChatGPT 進行形式化和多樣化處理。
優異的性能
在 GTZAN 數據集上實現了 64.82% 的零樣本音頻標籤準確率。

模型能力

音樂標籤生成
音樂描述生成
零樣本學習

使用案例

音樂分類
流派識別
識別音樂的流派,如流行、搖滾等。
在 GTZAN 數據集上準確率 64.82%
情緒分析
分析音樂的情緒,如憂鬱、快樂等。
音樂推薦
場景匹配
根據音樂標籤推薦適合的場景,如酒吧、運動等。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase