🚀 音乐流派分类模型 🎶
该模型基于音频信号(.wav)对音乐流派进行分类。它在 Wav2Vec2 模型的基础上进行微调,并使用了数据集 music_genres_small。
你可以在 GitHub 仓库中找到一个由 Flask API 托管的界面,用于测试该模型:音乐分类器仓库
✨ 主要特性
- 基于音频信号对音乐流派进行分类。
- 在 Wav2Vec2 模型基础上微调,使用特定数据集训练。
- 提供了用于测试模型的 GitHub 仓库和 Flask API 界面。
📦 安装指南
文档未提供安装步骤,跳过该章节。
💻 使用示例
基础用法
from transformers import Wav2Vec2ForSequenceClassification, Wav2Vec2FeatureExtractor
import librosa
import torch
genre_mapping = {
0: "Electronic",
1: "Rock",
2: "Punk",
3: "Experimental",
4: "Hip-Hop",
5: "Folk",
6: "Chiptune / Glitch",
7: "Instrumental",
8: "Pop",
9: "International",
}
model = Wav2Vec2ForSequenceClassification.from_pretrained("gastonduault/music-classifier")
feature_extractor = Wav2Vec2FeatureExtractor.from_pretrained("facebook/wav2vec2-large")
def preprocess_audio(audio_path):
audio_array, sampling_rate = librosa.load(audio_path, sr=16000)
return feature_extractor(audio_array, sampling_rate=16000, return_tensors="pt", padding=True)
audio_path = "./Nirvana - Come As You Are.wav"
inputs = preprocess_audio(audio_path)
with torch.no_grad():
logits = model(**inputs).logits
predicted_class = torch.argmax(logits, dim=-1).item()
print(f"song analized:{audio_path}")
print(f"Predicted genre: {genre_mapping[predicted_class]}")
高级用法
文档未提供高级用法代码示例,跳过该部分。
📚 详细文档
指标
属性 |
详情 |
验证准确率 |
75% |
F1 分数 |
74% |
验证损失 |
0.77 |
标签信息
标签类型 |
详情 |
数据集 |
lewtun/music_genres_small |
基础模型 |
facebook/wav2vec2-large |
指标 |
accuracy、f1 |
标签 |
audio、music、classification、Wav2Vec2 |
管道标签 |
audio-classification |
🔧 技术细节
文档未提供技术实现细节,跳过该章节。
📄 许可证
文档未提供许可证信息,跳过该章节。