W

Wav2vec2 Base 100k Eating Sound Collection

由m3hrdadfi開發
基於Wav2Vec 2.0架構的進食聲音分類模型,能夠識別20種不同的食物進食聲音
下載量 26
發布時間 : 3/2/2022

模型概述

該模型使用Wav2Vec 2.0架構進行訓練,專門用於分類不同類型的食物進食聲音。可以識別從薯片到軟糖等多種食物的咀嚼聲音。

模型特點

高精度分類
能夠準確識別20種不同食物的進食聲音,平均準確率達到89%
基於Wav2Vec 2.0架構
利用Wav2Vec 2.0強大的音頻特徵提取能力進行聲音分類
即用型模型
提供預訓練模型,可直接用於預測,無需額外訓練

模型能力

音頻分類
進食聲音識別
多類別分類

使用案例

健康與營養
飲食監測
通過分析進食聲音自動記錄飲食內容
可識別20種不同食物的進食行為
智能家居
智能廚房應用
識別家庭成員進食習慣
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase