ast-finetuned-audioset オープンソースオーディオ分類モデル - 無料でデプロイし、音楽ジャンルを的確に識別

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

nomad-aiによって開発

これはAST(Audio Spectrogram Transformer)アーキテクチャに基づくオーディオ分類モデルで、GTZAN音楽ジャンル分類データセットでファインチューニングされています。

ダウンロード数 15

リリース時間 : 8/9/2023

モデル概要

このモデルは音楽ジャンル分類タスク専用で、10種類の異なる音楽ジャンルを識別できます。Transformerアーキテクチャを使用してオーディオスペクトログラムを処理し、GTZANデータセットで90%の精度を達成しました。

高精度

GTZAN音楽ジャンル分類タスクで90%の精度を達成

Transformerアーキテクチャベース

Audio Spectrogram Transformerを使用してオーディオスペクトルを処理し、効果的にオーディオ特徴を捕捉

事前学習+ファインチューニング

最初にAudioSetデータセットで事前学習し、次にGTZANデータセットでファインチューニング

音楽ジャンル分類

オーディオ特徴抽出

オーディオコンテンツ分析

音楽サービス

音楽自動分類

音楽ストリーミングプラットフォームにアップロードされた音楽ファイルを自動分類

10種類の異なる音楽ジャンルを正確に識別

プレイリスト生成

音楽ジャンルに基づいて個性化されたプレイリストを自動生成

音楽研究

音楽スタイル分析

音楽学研究を支援し、異なる音楽スタイルの特徴を分析