omr_transformerオープンソースモデル - 音楽画像を無料でLilyPond形式の音符に変換

ホーム

Omr Transformer

Flovaによって開発

これは光学音楽認識のための画像からテキストへのモデルで、画像からLilyPond形式で表された音符を予測できます。

画像生成テキスト

Transformers

英語オープンソースライセンス:Apache-2.0 #楽譜認識 #LilyPond形式出力 #手書き音符認識

ダウンロード数 98

リリース時間 : 3/16/2023

モデル概要

このモデルは、与えられた画像からLilyPond形式で表された簡単な音符を予測するように訓練されており、人工的に合成された画像、手書き画像、ホワイトボード画像をサポートしています。

モデル特徴

多種類の画像サポート

人工的に合成された画像、手書き画像、ホワイトボード画像など、さまざまな種類の音楽記号画像を処理できます。

LilyPond形式出力

予測結果はLilyPond形式で表示され、音楽の編集と組版が容易です。

Donutアーキテクチャベース

先進的なDonutアーキテクチャを採用し、画像からテキストへの変換性能を最適化しています。

モデル能力

光学音楽認識

画像からテキストへの変換

音符予測

使用事例

音楽教育

ホワイトボード音楽記号認識

ホワイトボードに手書きされた音楽記号を認識し、デジタル形式に変換します

LilyPond形式の音符シーケンスを正確に予測

手書き楽譜のデジタル化

手書き楽譜を編集可能なデジタル形式に変換します

手書き音符の正確な認識を示す例

音楽制作

楽譜の迅速入力

手書き楽譜を撮影して迅速にデジタル楽譜を生成します

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Omr Transformer

モデル概要

モデル特徴

モデル能力

使用事例

🚀 光学楽譜認識トランスフォーマー

🚀 クイックスタート

デモ

📄 ライセンス