🚀 SoundSlayerAI
SoundSlayerAI 是一個專注於音樂相關任務的創新項目。它旨在為音頻分析和處理提供多種功能,讓處理音樂數據集變得更加輕鬆。
🚀 快速開始
若要使用 SoundSlayerAI,請按以下步驟操作:
- 運行
pip install pyannote-audio
安裝所需依賴。
- 從
pyannote.audio
包導入必要的模塊,以使用所需功能。
- 加載音頻數據或使用提供的數據集,執行音頻分割、說話人分割、音樂轉錄等任務。
- 應用
pyannote.audio
庫中的適當算法和模型,對音頻數據進行處理和分析。
- 使用指定的指標(如準確率、Bertscore、BLEU、BLEURT、Brier Score 和字符指標)評估結果。
- 反覆迭代並優化方法,以實現音樂相關任務的預期效果。
✨ 主要特性
- 豐富的數據集支持:利用眾多公開數據集,涵蓋音樂、歌詞、語音等多方面數據。
- 強大的音頻處理庫:核心使用
pyannote-audio
庫,具備音頻分割、說話人分割、音樂轉錄等多種功能。
- 多指標評估:採用多種指標(如準確率、Bertscore 等)評估模型性能。
📦 安裝指南
運行以下命令安裝所需依賴:
pip install pyannote-audio
📚 詳細文檔
數據集
SoundSlayerAI 使用了以下數據集:
- Fhrozen/AudioSet2K22
- Chr0my/Epidemic_sounds
- ChristophSchuhmann/lyrics-index
- Cropinky/rap_lyrics_english
- tsterbak/eurovision-lyrics-1956-2023
- brunokreiner/genius-lyrics
- google/MusicCaps
- ccmusic-database/music_genre
- Hyeon2/riffusion-musiccaps-dataset
- SamAct/autotrain-data-musicprompt
- Chr0my/Epidemic_music
- juliensimon/autonlp-data-song-lyrics
- Datatang/North_American_English_Speech_Data_by_Mobile_Phone_and_PC
- Chr0my/freesound.org
- teticio/audio-diffusion-256
- KELONMYOSA/dusha_emotion_audio
- Ar4ikov/iemocap_audio_text_splitted
- flexthink/ljspeech
- mozilla-foundation/common_voice_13_0
- facebook/voxpopuli
- SocialGrep/one-million-reddit-jokes
- breadlicker45/human-midi-rlhf
- breadlicker45/midi-gpt-music-small
- projectlosangeles/Los-Angeles-MIDI-Dataset
- huggingartists/epic-rap-battles-of-history
- SocialGrep/one-million-reddit-confessions
- shahules786/prosocial-nsfw-reddit
- Thewillonline/reddit-sarcasm
- autoevaluate/autoeval-eval-futin__guess-vi-4200fb-2012366606
- lmsys/chatbot_arena_conversations
- mozilla-foundation/common_voice_11_0
- mozilla-foundation/common_voice_4_0
- dell-research-harvard/AmericanStories
- zZWipeoutZz/insane_style
- mu-llama/MusicQA
- RaphaelOlivier/whisper_adversarial_examples
- huggingartists/metallica
- vldsavelyev/guitar_tab
- NLPCoreTeam/humaneval_ru
- seungheondoh/audioset-music
- gary109/onset-singing3_corpora_parliament_processed_MIR-ST500
- LDD5522/Rock_Vocals
- huggingartists/rage-against-the-machine
- huggingartists/chester-bennington
- huggingartists/logic
- cmsolson75/artist_song_lyric_dataset
- BhavyaMuni/artist-lyrics
- vjain/emotional_intelligence
- mhenrichsen/context-aware-splits
庫
本項目使用的核心庫是 pyannote-audio
。該庫為音頻分析和處理提供了廣泛的功能,是處理音樂數據集的絕佳選擇。pyannote-audio
庫提供了一套全面的工具和算法,可用於音頻分割、說話人分割、音樂轉錄等任務。
指標
為評估 SoundSlayerAI 的性能,採用了以下幾種指標:
- 準確率
- Bertscore
- BLEU
- BLEURT
- Brier Score
- 字符指標
這些指標有助於評估所實現算法和模型的有效性和準確性。
語言
SoundSlayerAI 項目主要專注於英語。項目中使用的數據集和模型針對英語音頻和文本分析任務進行了優化。
📄 許可證
SoundSlayerAI 採用 Openrail 許可證發佈。更多詳細信息請參考 LICENSE
文件。
💪 貢獻
歡迎對 SoundSlayerAI 進行貢獻!如果您有任何想法、修復的 bug 或改進建議,請隨時在 GitHub 倉庫提交拉取請求或創建問題。
📞 聯繫
如果您對 SoundSlayerAI 有任何疑問或諮詢,請通過 [插入郵箱地址] 聯繫項目維護者。
感謝您對 SoundSlayerAI 的關注!