S

SER Odyssey Baseline WavLM Valence

由3loi開發
基於WavLM架構的語音情緒識別模型,專門用於預測語音中的效價(valence)值,範圍為0到1。
下載量 71
發布時間 : 3/15/2024

模型概述

該模型是針對Odyssey 2024情緒識別競賽開發的基線模型,專注於單任務效價預測,基於MSP-Podcast數據集訓練。

模型特點

高效價預測
專注於語音中的效價(valence)預測,輸出範圍在0到1之間。
基於MSP-Podcast數據集
使用MSP-Podcast數據集訓練,該數據集專門用於語音情緒識別研究。
競賽基線模型
作為Odyssey 2024情緒識別競賽的基線模型,具有可靠的性能基準。

模型能力

語音情緒識別
效價預測
音頻分類

使用案例

語音情緒分析
語音情感分析
分析語音中的情緒效價,用於情感計算和人機交互。
在Odyssey競賽Test3和開發集上CCC指標分別為0.607和0.709。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase