W

Wav2vec2 Large Superb Sid

Developed by superb
Wav2Vec2-Large アーキテクチャに基づく話者認識モデルで、VoxCeleb1 データセットでトレーニングされ、音声を話者IDごとに分類するために使用されます
Downloads 27
Release Time : 3/2/2022

Model Overview

このモデルは、Facebookのwav2vec2-large-lv60モデルをファインチューニングした話者認識用の音声分類モデルで、異なる話者の音声特徴を識別し分類することができます。

Model Features

高精度
VoxCeleb1テストセットで86.13%の精度を達成
Wav2Vec2事前学習モデルベース
wav2vec2-large-lv60の強力な音声表現能力を活用してファインチューニング
16kHz音声サポート
16kHzサンプリングの音声に最適化

Model Capabilities

話者認識
音声分類
音声特徴抽出

Use Cases

セキュリティ認証
音声認証
音声によるユーザー認証を実現
音声分析
会議議事録分析
会議録音から各発言者を識別
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase