A

Ast Finetuned Model

由forwarder1121開發
這是一個基於音頻頻譜圖變壓器(AST)的微調模型,專門用於語音音頻中的情感分類。
下載量 174
發布時間 : 11/17/2024

模型概述

該模型在CREMA-D數據集上進行了微調,專注於六種情感類別(憤怒、厭惡、恐懼、快樂、中性、悲傷),適用於語音情感識別任務。

模型特點

基於音頻頻譜圖變壓器
採用先進的音頻頻譜圖變壓器架構,能夠有效捕捉語音中的情感特徵。
六種情感分類
支持憤怒、厭惡、恐懼、快樂、中性和悲傷六種情感類別的識別。
數據增強
訓練過程中使用了噪聲注入、時間偏移和速度擾動等數據增強技術,提升模型魯棒性。

模型能力

語音情感識別
音頻分類
情感分析

使用案例

人機交互
智能客服情感分析
用於分析用戶在客服通話中的情感狀態,提升服務質量。
心理健康
情緒狀態監測
通過語音分析用戶的情緒變化,用於心理健康應用。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase