S

Spkrec Xvect Voxceleb

speechbrainによって開発
これはSpeechBrainで事前学習されたTDNNモデルで、話者の埋め込みベクトルを抽出するために使用され、主に話者認証と認識タスクに適用されます。
ダウンロード数 27.68k
リリース時間 : 3/2/2022

モデル概要

このシステムはTDNNモデルと統計プーリングを組み合わせており、分類クロスエントロピー損失を使用して訓練され、音声から話者の特徴埋め込みベクトルを抽出できます。

モデル特徴

効率的な話者埋め込み抽出
音声から話者の特徴埋め込みベクトルを迅速かつ正確に抽出できます。
VoxCelebデータセットに基づく訓練
VoxCeleb1+VoxCeleb2の訓練データを使用して訓練されており、高い認識精度を持っています。
自動音声前処理
入力音声に対して自動的に正規化処理を行い、リサンプリングとモノラル選択を含みます。

モデル能力

話者認証
話者認識
音声特徴抽出

使用事例

セキュリティ認証
音声認証
電話銀行やその他の音声認証が必要なシナリオで使用されます。
VoxCeleb1テストセット(クリーンバージョン)で3.2%の等誤り率(EER)を達成しました。
スマートデバイス
パーソナライズド音声アシスタント
異なるユーザーに個別化された音声アシスタントサービスを提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase