W

Wav2vec2 Base Ft Keyword Spotting

anton-lによって開発
facebook/wav2vec2-baseをSUPERBデータセットでファインチューニングした音声キーワード認識モデルで、精度は98.26%を達成
ダウンロード数 70
リリース時間 : 3/2/2022

モデル概要

このモデルはキーワード認識用の音声分類モデルで、wav2vec2アーキテクチャを基にファインチューニングされており、音声から特定のキーワードを検出するのに優れています

モデル特徴

高精度
評価データセットで98.26%の精度を達成し、優れた性能を発揮
wav2vec2アーキテクチャ採用
実績のあるwav2vec2-baseアーキテクチャをベースモデルとして採用
効率的なファインチューニング
SUPERBデータセットでターゲットを絞ったファインチューニングを行い、キーワード認識能力を最適化

モデル能力

音声分類
キーワード認識
音声特徴抽出

使用事例

スマートホーム
音声ウェイクアップ
スマートデバイスの音声ウェイクアップ機能に使用
高精度でウェイクアップワードを認識
音声アシスタント
コマンドワード認識
ユーザーの音声コマンドからキーとなるコマンドワードを認識
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase