🚀 音樂流派分類模型 🎶
該模型基於音頻信號(.wav)對音樂流派進行分類。它在 Wav2Vec2 模型的基礎上進行微調,並使用了數據集 music_genres_small。
你可以在 GitHub 倉庫中找到一個由 Flask API 託管的界面,用於測試該模型:音樂分類器倉庫
✨ 主要特性
- 基於音頻信號對音樂流派進行分類。
- 在 Wav2Vec2 模型基礎上微調,使用特定數據集訓練。
- 提供了用於測試模型的 GitHub 倉庫和 Flask API 界面。
📦 安裝指南
文檔未提供安裝步驟,跳過該章節。
💻 使用示例
基礎用法
from transformers import Wav2Vec2ForSequenceClassification, Wav2Vec2FeatureExtractor
import librosa
import torch
genre_mapping = {
0: "Electronic",
1: "Rock",
2: "Punk",
3: "Experimental",
4: "Hip-Hop",
5: "Folk",
6: "Chiptune / Glitch",
7: "Instrumental",
8: "Pop",
9: "International",
}
model = Wav2Vec2ForSequenceClassification.from_pretrained("gastonduault/music-classifier")
feature_extractor = Wav2Vec2FeatureExtractor.from_pretrained("facebook/wav2vec2-large")
def preprocess_audio(audio_path):
audio_array, sampling_rate = librosa.load(audio_path, sr=16000)
return feature_extractor(audio_array, sampling_rate=16000, return_tensors="pt", padding=True)
audio_path = "./Nirvana - Come As You Are.wav"
inputs = preprocess_audio(audio_path)
with torch.no_grad():
logits = model(**inputs).logits
predicted_class = torch.argmax(logits, dim=-1).item()
print(f"song analized:{audio_path}")
print(f"Predicted genre: {genre_mapping[predicted_class]}")
高級用法
文檔未提供高級用法代碼示例,跳過該部分。
📚 詳細文檔
指標
屬性 |
詳情 |
驗證準確率 |
75% |
F1 分數 |
74% |
驗證損失 |
0.77 |
標籤信息
標籤類型 |
詳情 |
數據集 |
lewtun/music_genres_small |
基礎模型 |
facebook/wav2vec2-large |
指標 |
accuracy、f1 |
標籤 |
audio、music、classification、Wav2Vec2 |
管道標籤 |
audio-classification |
🔧 技術細節
文檔未提供技術實現細節,跳過該章節。
📄 許可證
文檔未提供許可證信息,跳過該章節。