🚀 wav2vec2-base-Toronto_emotional_speech_set
該模型是基於 facebook/wav2vec2-base 在 audiofolder 數據集上進行微調的版本。它在解決音頻情感分類問題上表現出色,能夠準確識別音頻樣本中說話者的情感。
🚀 快速開始
此模型是 facebook/wav2vec2-base 在 audiofolder 數據集上的微調版本。它在評估集上取得了以下結果:
- 損失值:0.4925
- 準確率:0.8804
- 加權 F1 值:0.8837
- 微平均 F1 值:0.8804
- 宏平均 F1 值:0.8822
- 加權召回率:0.8804
- 微平均召回率:0.8804
- 宏平均召回率:0.8757
- 加權精確率:0.9044
- 微平均精確率:0.8804
- 宏平均精確率:0.9059
✨ 主要特性
- 情感分類:該模型能夠對音頻樣本中說話者的情感進行分類。
- 評估指標優秀:在評估集上,模型在損失、準確率、F1 值、召回率和精確率等多個指標上都取得了良好的成績。
📚 詳細文檔
模型描述
此模型用於對音頻樣本中說話者的情感進行分類。
如需瞭解該模型的創建方式,請查看以下鏈接:https://github.com/DunnBC22/Vision_Audio_and_Multimodal_Projects/blob/main/Audio-Projects/Emotion%20Detection/Toronto%20Emotional%20Speech%20Set%20(TESS)/Toronto%20Emotional%20Speech%20Set%20(TESS).ipynb
預期用途與限制
該模型旨在展示使用技術解決複雜問題的能力。
訓練和評估數據
數據集來源:https://www.kaggle.com/datasets/ejlok1/toronto-emotional-speech-set-tess
訓練過程
訓練超參數
訓練過程中使用了以下超參數:
- 學習率:3e - 05
- 訓練批次大小:32
- 評估批次大小:32
- 隨機種子:42
- 梯度累積步數:4
- 總訓練批次大小:128
- 優化器:Adam(β1 = 0.9,β2 = 0.999,ε = 1e - 08)
- 學習率調度器類型:線性
- 學習率調度器熱身比例:0.1
- 訓練輪數:15
訓練結果
訓練損失 |
輪數 |
步數 |
驗證損失 |
準確率 |
加權 F1 值 |
微平均 F1 值 |
宏平均 F1 值 |
加權召回率 |
微平均召回率 |
宏平均召回率 |
加權精確率 |
微平均精確率 |
宏平均精確率 |
1.9517 |
0.97 |
17 |
1.9432 |
0.2411 |
0.1338 |
0.2411 |
0.1201 |
0.2411 |
0.2411 |
0.2168 |
0.1161 |
0.2411 |
0.1049 |
1.9517 |
2.0 |
35 |
1.9036 |
0.3375 |
0.3037 |
0.3375 |
0.3082 |
0.3375 |
0.3375 |
0.3533 |
0.5364 |
0.3375 |
0.5379 |
1.9517 |
2.97 |
52 |
1.6629 |
0.4518 |
0.4020 |
0.4518 |
0.3936 |
0.4518 |
0.4518 |
0.4503 |
0.6751 |
0.4518 |
0.6555 |
1.9517 |
4.0 |
70 |
1.2026 |
0.7357 |
0.7121 |
0.7357 |
0.6989 |
0.7357 |
0.7357 |
0.7240 |
0.7903 |
0.7357 |
0.7848 |
1.9517 |
4.97 |
87 |
0.8458 |
0.8839 |
0.8796 |
0.8839 |
0.8767 |
0.8839 |
0.8839 |
0.8845 |
0.8874 |
0.8839 |
0.8807 |
1.9517 |
6.0 |
105 |
0.6493 |
0.8946 |
0.8939 |
0.8946 |
0.8914 |
0.8946 |
0.8946 |
0.8937 |
0.9049 |
0.8946 |
0.9014 |
1.9517 |
6.97 |
122 |
0.5149 |
0.9089 |
0.9046 |
0.9089 |
0.8989 |
0.9089 |
0.9089 |
0.8957 |
0.9275 |
0.9089 |
0.9327 |
1.9517 |
8.0 |
140 |
0.3814 |
0.9536 |
0.9531 |
0.9536 |
0.9501 |
0.9536 |
0.9536 |
0.9474 |
0.9577 |
0.9536 |
0.9583 |
1.9517 |
8.97 |
157 |
0.5627 |
0.85 |
0.8459 |
0.85 |
0.8402 |
0.85 |
0.85 |
0.8378 |
0.9100 |
0.85 |
0.9160 |
1.9517 |
10.0 |
175 |
0.4702 |
0.8911 |
0.8861 |
0.8911 |
0.8854 |
0.8911 |
0.8911 |
0.8938 |
0.9021 |
0.8911 |
0.8967 |
1.9517 |
10.97 |
192 |
0.3362 |
0.9393 |
0.9376 |
0.9393 |
0.9361 |
0.9393 |
0.9393 |
0.9399 |
0.9402 |
0.9393 |
0.9365 |
1.9517 |
12.0 |
210 |
0.3808 |
0.9179 |
0.9181 |
0.9179 |
0.9176 |
0.9179 |
0.9179 |
0.9180 |
0.9251 |
0.9179 |
0.9235 |
1.9517 |
12.97 |
227 |
0.4546 |
0.9036 |
0.9045 |
0.9036 |
0.9024 |
0.9036 |
0.9036 |
0.8988 |
0.9151 |
0.9036 |
0.9157 |
1.9517 |
14.0 |
245 |
0.5065 |
0.8786 |
0.8826 |
0.8786 |
0.8813 |
0.8786 |
0.8786 |
0.8742 |
0.9040 |
0.8786 |
0.9055 |
1.9517 |
14.57 |
255 |
0.4925 |
0.8804 |
0.8837 |
0.8804 |
0.8822 |
0.8804 |
0.8804 |
0.8757 |
0.9044 |
0.8804 |
0.9059 |
框架版本
- Transformers 4.27.4
- Pytorch 2.0.0
- Datasets 2.11.0
- Tokenizers 0.13.3
📄 許可證
本項目採用 Apache - 2.0 許可證。