music-classifier开源音频分类模型 - 轻松准确识别各类音乐流派

首页

Music Classifier

由 gastonduault 开发

基于Wav2Vec2的音频分类模型，用于识别音乐流派

音频分类

Safetensors

#音频分类 #音乐流派识别 #Wav2Vec2微调

下载量 478

发布时间 : 11/17/2024

模型简介

该模型通过对音频信号的分析，能够准确识别10种不同的音乐流派，适用于音乐分类、推荐系统等场景。

模型特点

高精度分类

在验证集上达到75%的准确率，能够有效区分10种不同音乐流派

基于Wav2Vec2

利用Wav2Vec2强大的音频特征提取能力，无需复杂的特征工程

端到端处理

直接从原始音频波形进行分类，简化了处理流程

模型能力

音频分类

音乐流派识别

音频特征提取

使用案例

音乐推荐系统

自动音乐分类

为音乐库中的歌曲自动添加流派标签

提高音乐分类效率，减少人工标注成本

音乐分析

音乐风格趋势分析

分析大量音乐作品的流派分布

帮助理解音乐市场趋势

🚀 音乐流派分类模型 🎶

该模型基于音频信号（.wav）对音乐流派进行分类。它在 Wav2Vec2 模型的基础上进行微调，并使用了数据集 music_genres_small。

你可以在 GitHub 仓库中找到一个由 Flask API 托管的界面，用于测试该模型：音乐分类器仓库

✨ 主要特性

基于音频信号对音乐流派进行分类。
在 Wav2Vec2 模型基础上微调，使用特定数据集训练。
提供了用于测试模型的 GitHub 仓库和 Flask API 界面。

📦 安装指南

文档未提供安装步骤，跳过该章节。

💻 使用示例

基础用法

from transformers import Wav2Vec2ForSequenceClassification, Wav2Vec2FeatureExtractor
import librosa
import torch

# Genre mapping corrected to a dictionary
genre_mapping = {
    0: "Electronic",
    1: "Rock",
    2: "Punk",
    3: "Experimental",
    4: "Hip-Hop",
    5: "Folk",
    6: "Chiptune / Glitch",
    7: "Instrumental",
    8: "Pop",
    9: "International",
}

model = Wav2Vec2ForSequenceClassification.from_pretrained("gastonduault/music-classifier")
feature_extractor = Wav2Vec2FeatureExtractor.from_pretrained("facebook/wav2vec2-large")

# Function for preprocessing audio for prediction
def preprocess_audio(audio_path):
    audio_array, sampling_rate = librosa.load(audio_path, sr=16000)
    return feature_extractor(audio_array, sampling_rate=16000, return_tensors="pt", padding=True)

# Path to your audio file
audio_path = "./Nirvana - Come As You Are.wav"

# Preprocess audio
inputs = preprocess_audio(audio_path)

# Predict
with torch.no_grad():
    logits = model(**inputs).logits
    predicted_class = torch.argmax(logits, dim=-1).item()

# Output the result
print(f"song analized:{audio_path}")
print(f"Predicted genre: {genre_mapping[predicted_class]}")

高级用法

文档未提供高级用法代码示例，跳过该部分。

📚 详细文档

指标

属性	详情
验证准确率	75%
F1 分数	74%
验证损失	0.77

标签信息

标签类型	详情
数据集	lewtun/music_genres_small
基础模型	facebook/wav2vec2-large
指标	accuracy、f1
标签	audio、music、classification、Wav2Vec2
管道标签	audio-classification