W

Wav2vec2 Base Superb Sid

由superb開發
基於Wav2Vec2-base預訓練模型,在VoxCeleb1數據集上微調的說話人識別模型,用於語音分類任務
下載量 1,489
發布時間 : 3/2/2022

模型概述

該模型是S3PRL的Wav2Vec2在SUPERB說話人識別任務的移植版本,能夠將每段語音按其說話人身份進行多分類

模型特點

基於Wav2Vec2預訓練模型
使用facebook/wav2vec2-base作為基礎模型,該模型基於16kHz採樣的語音音頻進行預訓練
VoxCeleb1數據集微調
在廣泛使用的VoxCeleb1數據集上進行微調,適用於說話人識別任務
高準確率
在測試集上達到75.18%的準確率

模型能力

說話人識別
語音分類
音頻特徵提取

使用案例

安全驗證
聲紋識別系統
用於身份驗證系統的說話人識別
可識別特定說話人身份
語音分析
會議記錄分析
識別會議錄音中不同發言人的語音片段
自動區分不同說話人
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase