L

Lang Id Voxlingua107 Ecapa

由speechbrain開發
基於SpeechBrain框架和ECAPA-TDNN架構的語音語言識別模型,支持107種語言的識別和語音嵌入向量提取。
下載量 330.01k
發布時間 : 3/2/2022

模型概述

該模型採用ECAPA-TDNN架構,在VoxLingua107數據集上訓練,可用於語音語言識別或作為語音片段特徵提取器。支持16kHz採樣率的單聲道音頻輸入。

模型特點

多語言支持
支持107種語言的識別,涵蓋全球主要語言和部分小語種
雙重用途
既可直接用於語言識別,也可作為特徵提取器用於構建專用模型
高性能架構
採用ECAPA-TDNN架構,在VoxLingua107開發集上錯誤率僅為6.7%
自動音頻處理
內置音頻標準化功能,自動處理採樣率和聲道轉換

模型能力

語音語言識別
語音特徵提取
多語言處理

使用案例

語音處理
多語言語音分類
識別語音片段所屬的語言類別
在VoxLingua107開發集上錯誤率6.7%
語音特徵提取
提取語音片段的嵌入向量用於下游任務
256維特徵向量
內容管理
多語言內容分類
對用戶生成的多語言語音內容進行分類管理
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase