H

Hubert Large Superb Sid

superbによって開発
Hubert-Largeアーキテクチャに基づく話者認識モデルで、VoxCeleb1データセットで訓練され、音声分類タスクに使用されます
ダウンロード数 349
リリース時間 : 3/2/2022

モデル概要

このモデルはHubert-Largeアーキテクチャに基づく話者認識システムで、特定の話者IDに音声クリップを分類するために特別に設計されています。16kHzサンプリングの音声データで事前訓練されており、話者認識タスクに適しています。

モデル特徴

高精度
VoxCeleb1テストセットで90.35%の精度を達成
16kHzサンプリング対応
16kHzサンプリングの音声データに最適化
事前訓練モデルのファインチューニング
hubert-large-ll60k事前訓練モデルを基にファインチューニング

モデル能力

話者認識
音声分類
音響特徴抽出

使用事例

セキュリティ認証
音声生体認証
音声ベースの認証システムに使用
登録ユーザーの音声特徴を正確に識別可能
音声分析
話者区別
会議記録で異なる話者を区別
話者タグ付きの会議議事録の自動生成を支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase