W

Wavlm Basic S R 5c 8batch 5sec 0.0001lr Unfrozen

由reralle開發
基於microsoft/wavlm-large微調的語音處理模型,在評估集上準確率達75%
下載量 16
發布時間 : 4/30/2023

模型概述

該模型是針對語音處理任務優化的WavLM架構變體,適用於短音頻片段分析

模型特點

高效微調
使用0.0001學習率進行精細調整,保持預訓練模型核心能力
短音頻處理
針對5秒音頻片段優化,適合即時處理場景
穩定訓練
採用梯度累積(步數4)和線性學習率調度,確保訓練穩定性

模型能力

語音特徵提取
短音頻分類
語音模式識別

使用案例

語音分析
情感識別
分析短語音片段中的情感傾向
準確率75%
語音指令分類
識別短語音命令類別
F1分數0.75
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase