S

SER Odyssey Baseline WavLM Arousal

由3loi開發
基於WavLM架構的語音情緒識別基線模型,專門用於預測語音中的喚醒度值(0-1範圍)
下載量 72
發布時間 : 3/15/2024

模型概述

該模型是Odyssey 2024情緒識別競賽的基線模型,基於MSP-Podcast數據集訓練,專注於單任務喚醒度預測。

模型特點

高精度喚醒度預測
在Test3和開發集上分別達到0.566和0.651的CCC指標
單任務專注設計
專門優化用於喚醒度預測,避免多任務干擾
標準化音頻處理
內置均值/標準差標準化流程,確保輸入一致性

模型能力

語音情緒分析
喚醒度值預測
音頻特徵提取

使用案例

心理健康監測
語音情緒狀態評估
通過語音分析用戶的情緒喚醒程度
可量化輸出0-1範圍的喚醒度值
人機交互
智能客服情緒響應
即時檢測用戶語音情緒狀態以調整響應策略
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase