W

Wav2vec2 Large Superb Ic

由superb開發
基於Wav2Vec2-Large-LV60的意圖分類模型,在SUPERB意圖分類任務上微調,用於語音指令的意圖識別
下載量 110
發布時間 : 3/2/2022

模型概述

該模型是基於Facebook的wav2vec2-large-lv60模型在SUPERB意圖分類任務上的微調版本,專門用於識別語音指令中的動作、對象和位置意圖。

模型特點

高準確率
在SUPERB測試集上達到95.28%的準確率
多標籤分類
可同時識別語音指令中的動作、對象和位置三個維度的意圖
16kHz音頻支持
專門針對16kHz採樣的語音音頻優化

模型能力

語音意圖識別
多標籤分類
語音指令理解

使用案例

智能家居
語音控制指令理解
識別用戶對智能設備的控制指令,如'打開廚房的燈'
準確識別動作(打開)、對象(燈)和位置(廚房)
語音助手
用戶意圖理解
理解用戶語音指令的深層意圖
幫助語音助手更準確地響應用戶請求
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase