L

Lang Id Voxlingua107 Ecapa

由apenasissso開發
基於VoxLingua107數據集訓練的ECAPA-TDNN架構口語識別模型,支持107種語言分類
下載量 19
發布時間 : 10/23/2023

模型概述

該模型用於口語識別和語音片段級別的特徵提取,採用ECAPA-TDNN架構,在VoxLingua107數據集上訓練

模型特點

多語言支持
支持107種不同語言的識別,涵蓋全球主要語種
ECAPA-TDNN架構
採用先進的ECAPA-TDNN架構,優化了語音嵌入提取性能
自動音頻處理
自動處理16kHz採樣率的音頻,包括重採樣和單聲道轉換
雙重用途
既可直接用於語言識別,也可作為特徵提取器用於下游任務

模型能力

口語識別
語音特徵提取
多語言分類

使用案例

語言識別
多語言語音分類
識別語音片段所屬的語言類別
在VoxLingua107開發集上達到6.7%錯誤率
語音處理
語音嵌入提取
提取語音片段的特徵向量用於下游任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase