P

Perceiver Ar Sam Giant Midi

由krasserm開發
基於Perceiver AR架構的符號音頻模型,在GiantMIDI-Piano數據集上預訓練,用於符號音頻生成
下載量 153
發布時間 : 5/3/2023

模型概述

該模型是一個基於Perceiver AR架構的符號音頻模型,主要用於基於用戶定義初始潛在標記數量的音頻生成。

模型特點

長上下文處理能力
通過混合自注意力與交叉注意力機制,可處理比純自注意力解碼器更長的上下文(最長6144個標記)。
旋轉位置編碼
採用旋轉位置編碼進行相對位置編碼,提升模型對序列位置關係的理解能力。
符號音頻建模
專門針對MIDI格式的符號音頻數據進行建模和生成。

模型能力

符號音頻生成
音樂續寫
MIDI文件生成

使用案例

音樂創作
音樂片段續寫
基於用戶提供的音樂片段提示,自動生成後續音樂內容
可生成風格連貫的音樂續寫片段
音樂風格模仿
通過學習特定風格的MIDI數據,生成類似風格的音樂
可模仿訓練數據中的音樂風格特徵
教育娛樂
音樂創作輔助
為音樂學習者提供創作靈感和素材
可生成簡單旋律供學習和改編
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase