P

Perceiver Ar Sam Giant Midi

Developed by krasserm
基於Perceiver AR架構的符號音頻模型,在GiantMIDI-Piano數據集上預訓練,用於符號音頻生成
Downloads 153
Release Time : 5/3/2023

Model Overview

該模型是一個基於Perceiver AR架構的符號音頻模型,主要用於基於用戶定義初始潛在標記數量的音頻生成。

Model Features

長上下文處理能力
通過混合自注意力與交叉注意力機制,可處理比純自注意力解碼器更長的上下文(最長6144個標記)。
旋轉位置編碼
採用旋轉位置編碼進行相對位置編碼,提升模型對序列位置關係的理解能力。
符號音頻建模
專門針對MIDI格式的符號音頻數據進行建模和生成。

Model Capabilities

符號音頻生成
音樂續寫
MIDI文件生成

Use Cases

音樂創作
音樂片段續寫
基於用戶提供的音樂片段提示,自動生成後續音樂內容
可生成風格連貫的音樂續寫片段
音樂風格模仿
通過學習特定風格的MIDI數據,生成類似風格的音樂
可模仿訓練數據中的音樂風格特徵
教育娛樂
音樂創作輔助
為音樂學習者提供創作靈感和素材
可生成簡單旋律供學習和改編
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase