W

Wav2vec2 Base Superb Er

由superb開發
這是一個基於Wav2Vec2架構的語音情感識別模型,移植自S3PRL項目,用於識別語音中的情感類別。
下載量 28.14k
發布時間 : 3/2/2022

模型概述

該模型基於wav2vec2-base架構,在16kHz採樣的語音音頻上進行預訓練,專門用於情感識別任務。

模型特點

基於Wav2Vec2架構
採用高效的wav2vec2-base架構,在語音處理任務中表現優異
情感分類
能夠識別語音中的四種主要情感類別
16kHz採樣支持
專門針對16kHz採樣的語音音頻進行優化

模型能力

語音情感識別
音頻分類

使用案例

情感分析
客服語音分析
分析客服通話中的客戶情緒
可識別高興、中性等情緒狀態
心理狀態評估
通過語音分析評估說話者的心理狀態
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase