H

Hubert Large Superb Sid

由superb開發
基於Hubert-Large架構的說話人識別模型,在VoxCeleb1數據集上訓練,用於語音分類任務
下載量 349
發布時間 : 3/2/2022

模型概述

該模型是基於Hubert-Large架構的說話人識別系統,專門用於將語音片段分類到特定的說話人身份。模型在16kHz採樣的語音數據上預訓練,適用於說話人識別任務。

模型特點

高準確率
在VoxCeleb1測試集上達到90.35%的準確率
16kHz採樣支持
專門針對16kHz採樣的語音數據進行優化
預訓練模型微調
基於hubert-large-ll60k預訓練模型進行微調

模型能力

說話人識別
語音分類
音頻特徵提取

使用案例

安全認證
語音生物識別
用於基於語音的身份驗證系統
可準確識別註冊用戶的語音特徵
語音分析
說話人區分
在會議記錄中區分不同說話人
幫助自動生成帶說話人標籤的會議記錄
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase