Omr Transformer

O

Omr Transformer

由Flova開發

這是一個用於光學音樂識別的圖像到文本模型，能夠從圖像中預測出以LilyPond格式表示的音符。

圖像生成文本

英語開源協議:Apache-2.0 #樂譜識別 #LilyPond格式輸出 #手寫音符識別

下載量 98

發布時間 : 3/16/2023

模型概述

該模型經過訓練，能夠從給定圖像中預測出以LilyPond格式表示的簡單音符，支持人工合成圖像、手寫圖像和白板圖像。

模型特點

多類型圖像支持

能夠處理人工合成圖像、手寫圖像和白板圖像等多種類型的音樂符號圖像。

LilyPond格式輸出

預測結果以LilyPond格式表示，便於音樂編輯和排版。

基於Donut架構

採用先進的Donut架構，優化了圖像到文本的轉換性能。

模型能力

光學音樂識別

圖像到文本轉換

音符預測

使用案例

音樂教育

白板音樂符號識別

識別白板上手寫的音樂符號並轉換為數字格式

準確預測出LilyPond格式的音符序列

手寫樂譜數字化

將手寫樂譜轉換為可編輯的數字格式

示例中展示了對手寫音符的準確識別

音樂製作

樂譜快速錄入

通過拍攝手寫樂譜快速生成數字樂譜

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase