O

Omr Transformer

Flovaによって開発
これは光学音楽認識のための画像からテキストへのモデルで、画像からLilyPond形式で表された音符を予測できます。
ダウンロード数 98
リリース時間 : 3/16/2023

モデル概要

このモデルは、与えられた画像からLilyPond形式で表された簡単な音符を予測するように訓練されており、人工的に合成された画像、手書き画像、ホワイトボード画像をサポートしています。

モデル特徴

多種類の画像サポート
人工的に合成された画像、手書き画像、ホワイトボード画像など、さまざまな種類の音楽記号画像を処理できます。
LilyPond形式出力
予測結果はLilyPond形式で表示され、音楽の編集と組版が容易です。
Donutアーキテクチャベース
先進的なDonutアーキテクチャを採用し、画像からテキストへの変換性能を最適化しています。

モデル能力

光学音楽認識
画像からテキストへの変換
音符予測

使用事例

音楽教育
ホワイトボード音楽記号認識
ホワイトボードに手書きされた音楽記号を認識し、デジタル形式に変換します
LilyPond形式の音符シーケンスを正確に予測
手書き楽譜のデジタル化
手書き楽譜を編集可能なデジタル形式に変換します
手書き音符の正確な認識を示す例
音楽制作
楽譜の迅速入力
手書き楽譜を撮影して迅速にデジタル楽譜を生成します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase