O

Openjmla

UniMusによって開発
OpenJMLAはゼロショット音楽タグシステムであり、音楽と言語のアテンションモデルを統合することで、オープンセット音楽タグ問題を解決します。
ダウンロード数 116
リリース時間 : 12/5/2023

モデル概要

OpenJMLAはオープンセット音楽タグ問題を解決することを目的としており、音楽と言語のアテンション(JMLA)モデルを統合することでゼロショット音楽タグシステムを実現し、関連するデータセットで優れた成績を収めています。

モデル特徴

オープンセット音楽タグ
従来のクローズドセット音楽タグが新しいタグに拡張できない問題を解決しました。
革新的なモデルアーキテクチャ
オーディオエンコーダと言語デコーダを組み合わせ、事前知覚リサンプラーと密集したアテンション接続を導入します。
大規模データセット
インターネットから収集した音楽と説明データを使用し、ChatGPTを通じて形式化と多様化処理を行います。
優れた性能
GTZANデータセットで64.82%のゼロショットオーディオタグ精度を実現しました。

モデル能力

音楽タグ生成
音楽説明生成
ゼロショット学習

使用事例

音楽分類
ジャンル識別
音楽のジャンルを識別します。例えば、ポップ、ロックなど。
GTZANデータセットでの精度は64.82%
感情分析
音楽の感情を分析します。例えば、憂鬱、楽しいなど。
音楽推薦
シーンマッチング
音楽タグに基づいて、バー、スポーツなどの適切なシーンを推薦します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase