L

Lang Id Voxlingua107 Ecapa

speechbrainによって開発
SpeechBrainフレームワークとECAPA-TDNNアーキテクチャに基づく音声言語識別モデルで、107言語の識別と音声埋め込みベクトル抽出をサポートします。
ダウンロード数 330.01k
リリース時間 : 3/2/2022

モデル概要

このモデルはECAPA-TDNNアーキテクチャを採用し、VoxLingua107データセットでトレーニングされており、音声言語識別や音声断片の特徴抽出器として使用できます。16kHzサンプリングレートのモノラル音声入力をサポートします。

モデル特徴

多言語サポート
107言語の識別をサポートし、世界の主要言語や一部の少数言語をカバーします
二重用途
言語識別に直接使用できるほか、専用モデル構築のための特徴抽出器としても利用可能
高性能アーキテクチャ
ECAPA-TDNNアーキテクチャを採用し、VoxLingua107開発セットでエラー率はわずか6.7%
自動音声処理
内蔵の音声正規化機能により、サンプリングレートやチャンネル変換を自動処理

モデル能力

音声言語識別
音声特徴抽出
多言語処理

使用事例

音声処理
多言語音声分類
音声断片の属する言語カテゴリを識別
VoxLingua107開発セットでエラー率6.7%
音声特徴抽出
下流タスク用に音声断片の埋め込みベクトルを抽出
256次元特徴ベクトル
コンテンツ管理
多言語コンテンツ分類
ユーザー生成の多言語音声コンテンツを分類管理
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase