A

Ast Finetuned Audioset 10 10 0.4593 Finetuned Gtzan

abnerhによって開発
このモデルはAudio Spectrogram Transformer (AST)をGTZAN音楽分類データセットでファインチューニングしたバージョンで、オーディオ分類タスクに使用され、精度は88%です。
ダウンロード数 2
リリース時間 : 10/16/2024

モデル概要

これはTransformerアーキテクチャに基づくオーディオ分類モデルで、音楽ジャンル分類タスクに特化してファインチューニングされています。

モデル特徴

高精度
GTZANデータセットで88%の分類精度を達成
Transformerアーキテクチャベース
Audio Spectrogram Transformerアーキテクチャを採用し、オーディオ信号処理に適している
事前学習+ファインチューニング
まずAudioSetデータセットで事前学習し、その後GTZANデータセットでファインチューニング

モデル能力

音楽ジャンル分類
オーディオ特徴抽出
オーディオ信号分析

使用事例

音楽分析
音楽ジャンル自動分類
オーディオファイルの音楽ジャンルを自動識別
精度88%
音楽推薦システム
音楽推薦システムの特徴抽出コンポーネントとして使用
オーディオ処理
オーディオ内容分析
オーディオ内容の特徴を分析
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase