O

Omr Transformer

由 Flova 开发
这是一个用于光学音乐识别的图像到文本模型,能够从图像中预测出以LilyPond格式表示的音符。
下载量 98
发布时间 : 3/16/2023

模型简介

该模型经过训练,能够从给定图像中预测出以LilyPond格式表示的简单音符,支持人工合成图像、手写图像和白板图像。

模型特点

多类型图像支持
能够处理人工合成图像、手写图像和白板图像等多种类型的音乐符号图像。
LilyPond格式输出
预测结果以LilyPond格式表示,便于音乐编辑和排版。
基于Donut架构
采用先进的Donut架构,优化了图像到文本的转换性能。

模型能力

光学音乐识别
图像到文本转换
音符预测

使用案例

音乐教育
白板音乐符号识别
识别白板上手写的音乐符号并转换为数字格式
准确预测出LilyPond格式的音符序列
手写乐谱数字化
将手写乐谱转换为可编辑的数字格式
示例中展示了对手写音符的准确识别
音乐制作
乐谱快速录入
通过拍摄手写乐谱快速生成数字乐谱
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase