music-classifier開源音頻分類模型 - 輕鬆準確識別各類音樂流派

首頁

Music Classifier

由gastonduault開發

基於Wav2Vec2的音頻分類模型，用於識別音樂流派

音頻分類

Safetensors

#音頻分類 #音樂流派識別 #Wav2Vec2微調

下載量 478

發布時間 : 11/17/2024

模型概述

該模型通過對音頻信號的分析，能夠準確識別10種不同的音樂流派，適用於音樂分類、推薦系統等場景。

模型特點

高精度分類

在驗證集上達到75%的準確率，能夠有效區分10種不同音樂流派

基於Wav2Vec2

利用Wav2Vec2強大的音頻特徵提取能力，無需複雜的特徵工程

端到端處理

直接從原始音頻波形進行分類，簡化了處理流程

模型能力

音頻分類

音樂流派識別

音頻特徵提取

使用案例

音樂推薦系統

自動音樂分類

為音樂庫中的歌曲自動添加流派標籤

提高音樂分類效率，減少人工標註成本

音樂分析

音樂風格趨勢分析

分析大量音樂作品的流派分佈

幫助理解音樂市場趨勢

🚀 音樂流派分類模型 🎶

該模型基於音頻信號（.wav）對音樂流派進行分類。它在 Wav2Vec2 模型的基礎上進行微調，並使用了數據集 music_genres_small。

你可以在 GitHub 倉庫中找到一個由 Flask API 託管的界面，用於測試該模型：音樂分類器倉庫

✨ 主要特性

基於音頻信號對音樂流派進行分類。
在 Wav2Vec2 模型基礎上微調，使用特定數據集訓練。
提供了用於測試模型的 GitHub 倉庫和 Flask API 界面。

📦 安裝指南

文檔未提供安裝步驟，跳過該章節。

💻 使用示例

基礎用法

from transformers import Wav2Vec2ForSequenceClassification, Wav2Vec2FeatureExtractor
import librosa
import torch

# Genre mapping corrected to a dictionary
genre_mapping = {
    0: "Electronic",
    1: "Rock",
    2: "Punk",
    3: "Experimental",
    4: "Hip-Hop",
    5: "Folk",
    6: "Chiptune / Glitch",
    7: "Instrumental",
    8: "Pop",
    9: "International",
}

model = Wav2Vec2ForSequenceClassification.from_pretrained("gastonduault/music-classifier")
feature_extractor = Wav2Vec2FeatureExtractor.from_pretrained("facebook/wav2vec2-large")

# Function for preprocessing audio for prediction
def preprocess_audio(audio_path):
    audio_array, sampling_rate = librosa.load(audio_path, sr=16000)
    return feature_extractor(audio_array, sampling_rate=16000, return_tensors="pt", padding=True)

# Path to your audio file
audio_path = "./Nirvana - Come As You Are.wav"

# Preprocess audio
inputs = preprocess_audio(audio_path)

# Predict
with torch.no_grad():
    logits = model(**inputs).logits
    predicted_class = torch.argmax(logits, dim=-1).item()

# Output the result
print(f"song analized:{audio_path}")
print(f"Predicted genre: {genre_mapping[predicted_class]}")

高級用法

文檔未提供高級用法代碼示例，跳過該部分。

📚 詳細文檔

指標

屬性	詳情
驗證準確率	75%
F1 分數	74%
驗證損失	0.77

標籤信息

標籤類型	詳情
數據集	lewtun/music_genres_small
基礎模型	facebook/wav2vec2-large
指標	accuracy、f1
標籤	audio、music、classification、Wav2Vec2
管道標籤	audio-classification