Omr Transformer
O
Omr Transformer
Flovaによって開発
これは光学音楽認識のための画像からテキストへのモデルで、画像からLilyPond形式で表された音符を予測できます。
ダウンロード数 98
リリース時間 : 3/16/2023
モデル概要
このモデルは、与えられた画像からLilyPond形式で表された簡単な音符を予測するように訓練されており、人工的に合成された画像、手書き画像、ホワイトボード画像をサポートしています。
モデル特徴
多種類の画像サポート
人工的に合成された画像、手書き画像、ホワイトボード画像など、さまざまな種類の音楽記号画像を処理できます。
LilyPond形式出力
予測結果はLilyPond形式で表示され、音楽の編集と組版が容易です。
Donutアーキテクチャベース
先進的なDonutアーキテクチャを採用し、画像からテキストへの変換性能を最適化しています。
モデル能力
光学音楽認識
画像からテキストへの変換
音符予測
使用事例
音楽教育
ホワイトボード音楽記号認識
ホワイトボードに手書きされた音楽記号を認識し、デジタル形式に変換します
LilyPond形式の音符シーケンスを正確に予測
手書き楽譜のデジタル化
手書き楽譜を編集可能なデジタル形式に変換します
手書き音符の正確な認識を示す例
音楽制作
楽譜の迅速入力
手書き楽譜を撮影して迅速にデジタル楽譜を生成します
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98