M

MERT V1 330M

由m-a-p開發
MERT-v1-330M是一個基於MLM範式訓練的高級音樂理解模型,具有330M參數規模,支持24K Hz音頻採樣率,適用於多種音樂信息檢索任務。
下載量 16.92k
發布時間 : 3/17/2023

模型概述

該模型採用掩碼語言建模(MLM)預訓練範式,通過大規模音樂數據集(160,000小時)訓練,具備優秀的音樂特徵提取和理解能力,適用於音樂分類、音樂生成等下游任務。

模型特點

大規模預訓練
使用160,000小時音樂數據進行訓練,覆蓋廣泛的音樂風格和類型
高音頻質量處理
支持24K Hz高採樣率音頻輸入,能捕捉更豐富的音樂細節
改進的MLM範式
採用EnCodec的8碼本偽標籤和批內噪聲混合技術,提升預訓練效果
多任務泛化能力
在下游音樂理解任務中表現出優秀的泛化性能

模型能力

音樂特徵提取
音樂風格分類
音樂情感識別
音樂生成支持

使用案例

音樂推薦系統
音樂風格分類
自動識別和分類音樂作品的風格特徵
可用於個性化音樂推薦系統的前端處理
音樂內容分析
音樂情感分析
分析音樂作品表達的情感特徵
適用於音樂治療、情緒識別等應用場景
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase