W

Wespeaker Voxceleb Resnet34 LM

由Wespeaker開發
基於ResNet34架構的說話人嵌入模型,經過大間隔微調,在VoxCeleb2數據集上訓練,支持說話人識別和相似度計算等任務。
下載量 33
發布時間 : 2/26/2024

模型概述

該模型用於提取說話人特徵嵌入,支持說話人識別、相似度計算和語音分割等任務。

模型特點

大間隔微調
模型經過大間隔微調,提高了說話人識別的準確率。
高效推理
模型參數量適中,計算量為4.55G,適合實際應用部署。
多功能支持
支持說話人嵌入提取、相似度計算、語音分割等多種任務。

模型能力

說話人特徵提取
說話人相似度計算
語音分割
說話人識別
說話人註冊與驗證

使用案例

安全認證
聲紋識別系統
用於身份驗證的聲紋識別系統
在VoxCeleb測試集上達到0.723的EER(等錯誤率)
語音分析
會議語音分割
自動分割會議錄音中不同說話人的片段
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase