L

Lang Id Voxlingua107 Ecapa

apenasisssoによって開発
VoxLingua107データセットでトレーニングされたECAPA-TDNNアーキテクチャの音声言語識別モデル、107言語の分類をサポート
ダウンロード数 19
リリース時間 : 10/23/2023

モデル概要

このモデルは音声言語識別と音声セグメントレベルの特徴抽出に使用され、ECAPA-TDNNアーキテクチャを採用し、VoxLingua107データセットでトレーニングされています

モデル特徴

多言語サポート
107の異なる言語の識別をサポートし、世界の主要言語をカバー
ECAPA-TDNNアーキテクチャ
先進的なECAPA-TDNNアーキテクチャを採用し、音声埋め込み抽出性能を最適化
自動音声処理
16kHzサンプリングレートの音声を自動処理、リサンプリングとモノラル変換を含む
二重用途
言語識別に直接使用できるほか、下流タスクの特徴抽出器としても使用可能

モデル能力

音声言語識別
音声特徴抽出
多言語分類

使用事例

言語識別
多言語音声分類
音声セグメントの属する言語カテゴリを識別
VoxLingua107開発セットで6.7%のエラー率を達成
音声処理
音声埋め込み抽出
下流タスク用に音声セグメントの特徴ベクトルを抽出
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase