distilhubert-finetuned-gtzanオープンソース音声分類モデル

Distilhubert Finetuned Gtzan

GFazzitoによって開発

distilhubertをベースにGTZAN音楽分類データセットでファインチューニングしたオーディオ分類モデル

ダウンロード数 18

リリース時間 : 7/21/2023

モデル概要

このモデルはdistilhubertアーキテクチャに基づく軽量オーディオ分類モデルで、音楽ジャンル分類タスクに特化してファインチューニングされています。GTZANデータセットで82%の精度を達成しました。

軽量アーキテクチャ

DistilHuBERTベースの軽量設計で、リソースが限られた環境に適しています

高精度

GTZAN音楽分類タスクで82%の精度を達成

迅速なファインチューニング

わずか10エポックのトレーニングで良好な性能を発揮

音楽ジャンル分類

オーディオ特徴量抽出

音楽分析

音楽ジャンル自動分類

音楽クリップをジャンル別に分類

精度82%を達成

音楽推薦システム

音楽推薦システムの特徴量抽出コンポーネントとして利用