W

Wav2vec2 Large Superb Sid

superbによって開発
Wav2Vec2-Large アーキテクチャに基づく話者認識モデルで、VoxCeleb1 データセットでトレーニングされ、音声を話者IDごとに分類するために使用されます
ダウンロード数 27
リリース時間 : 3/2/2022

モデル概要

このモデルは、Facebookのwav2vec2-large-lv60モデルをファインチューニングした話者認識用の音声分類モデルで、異なる話者の音声特徴を識別し分類することができます。

モデル特徴

高精度
VoxCeleb1テストセットで86.13%の精度を達成
Wav2Vec2事前学習モデルベース
wav2vec2-large-lv60の強力な音声表現能力を活用してファインチューニング
16kHz音声サポート
16kHzサンプリングの音声に最適化

モデル能力

話者認識
音声分類
音声特徴抽出

使用事例

セキュリティ認証
音声認証
音声によるユーザー認証を実現
音声分析
会議議事録分析
会議録音から各発言者を識別
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase