V

Voc2vec Hubert Ls Pt

由alkiskoudounas開發
voc2vec是專為非語言人類數據設計的基礎模型,基於HuBERT框架構建,在125小時非語言音頻數據上預訓練。
下載量 114
發布時間 : 4/14/2025

模型概述

該模型專注於非語言人類聲音的分類和分析,特別適用於嬰兒啼哭等非語言發聲場景。

模型特點

非語言發聲專用
專門針對非語言人類聲音(如嬰兒啼哭、笑聲等)優化的預訓練模型
多數據集預訓練
在10個不同數據集組成的125小時非語言音頻上進行預訓練
HuBERT架構
基於HuBERT框架構建,繼承了其優秀的音頻表示學習能力
遷移學習友好
從LibriSpeech預訓練模型繼續訓練,適合下游任務微調

模型能力

非語言音頻分類
嬰兒啼哭識別
音頻特徵提取

使用案例

嬰幼兒護理
嬰兒啼哭識別
識別和分析嬰兒不同類型的啼哭(飢餓、不適等)
在Donate a Cry等嬰兒啼哭數據集上表現優異
醫療輔助
非語言症狀分析
分析患者非語言發聲以輔助醫療診斷
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase