V

Voc2vec As Pt

由alkiskoudounas開發
voc2vec是一個專門為非語言人類數據設計的基礎模型,基於wav2vec 2.0框架構建。
下載量 31
發布時間 : 2/6/2025

模型概述

該模型用於非語言音頻分類任務,特別是嬰兒啼哭等非語言發聲的識別。

模型特點

非語言音頻處理
專門針對非語言人類聲音(如嬰兒啼哭)優化的模型
多數據集預訓練
在包含約125小時非語言音頻的10個數據集上預訓練
基於AudioSet繼續訓練
從一個最初在AudioSet數據集上訓練的模型繼續預訓練

模型能力

非語言音頻分類
嬰兒啼哭識別
音頻特徵提取

使用案例

醫療健康
嬰兒啼哭分析
用於識別和分析嬰兒的不同啼哭類型
語音研究
非語言發聲研究
用於研究人類非語言發聲的特徵和模式
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase