O

Omr Transformer

由Flova開發
這是一個用於光學音樂識別的圖像到文本模型,能夠從圖像中預測出以LilyPond格式表示的音符。
下載量 98
發布時間 : 3/16/2023

模型概述

該模型經過訓練,能夠從給定圖像中預測出以LilyPond格式表示的簡單音符,支持人工合成圖像、手寫圖像和白板圖像。

模型特點

多類型圖像支持
能夠處理人工合成圖像、手寫圖像和白板圖像等多種類型的音樂符號圖像。
LilyPond格式輸出
預測結果以LilyPond格式表示,便於音樂編輯和排版。
基於Donut架構
採用先進的Donut架構,優化了圖像到文本的轉換性能。

模型能力

光學音樂識別
圖像到文本轉換
音符預測

使用案例

音樂教育
白板音樂符號識別
識別白板上手寫的音樂符號並轉換為數字格式
準確預測出LilyPond格式的音符序列
手寫樂譜數字化
將手寫樂譜轉換為可編輯的數字格式
示例中展示了對手寫音符的準確識別
音樂製作
樂譜快速錄入
通過拍攝手寫樂譜快速生成數字樂譜
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase