W

Wav2vec2 Base Superb Sv

anton-lによって開発
これはWav2Vec2アーキテクチャに基づく話者検証モデルで、SUPERBベンチマークテストの話者検証タスク用に設計されています。
ダウンロード数 901
リリース時間 : 3/2/2022

モデル概要

このモデルは、S3PRLのWav2Vec2をSUPERB話者検証タスクに移植したバージョンで、wav2vec2-large-lv60モデルをベースに、話者識別と検証タスク用のXVectorヘッドを備えています。

モデル特徴

Wav2Vec2アーキテクチャに基づく
Wav2Vec2の自己教師付き学習フレームワークを利用して、強力な音声表現能力を提供します。
話者検証専用
話者検証タスクに特化して最適化され、XVectorヘッドを備えています。
16kHzサンプリング対応
16kHzサンプリングの音声入力をサポートし、元の事前学習データと一致します。

モデル能力

話者識別
話者検証
音声特徴抽出

使用事例

認証
音声生体認証
音声ベースの認証システムに使用されます。
音声分析
話者区別
複数人の会話で異なる話者を区別します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase