W

Wav2vec2 Base Superb Ks

superbによって開発
wav2vec2-baseをベースとしたSUPERBキーワード検出モデル、16kHz音声専用に設計
ダウンロード数 5,820
リリース時間 : 3/2/2022

モデル概要

このモデルはS3PRLから移植され、キーワード検出タスク用で、音声を事前定義された語彙に分類し登録キーワードを識別できます。

モデル特徴

高精度
Speech Commands v1.0テストセットで96.43%の精度を達成
デバイスフレンドリー
精度、モデルサイズ、推論速度のバランスを考慮したデバイスサイド実行向け設計
標準化処理
16kHz統一サンプリングレートを採用し、入力音声の標準化処理を確保

モデル能力

音声分類
キーワード認識
無音検出
未知語検出

使用事例

スマートデバイス制御
音声アシスタント起動語検出
'Hey Siri'や'OK Google'などのデバイス起動語を検出
高精度認識で誤作動を低減
アクセシビリティ技術
音声制御インターフェース
身体障害のあるユーザー向け音声制御コマンド認識を提供
効率的で正確なコマンド認識を実現
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase