W

Wav2vec2 Base Superb Ks

Xenovaによって開発
wav2vec2アーキテクチャに基づくオーディオ分類モデルで、キーワード検出タスクに適しています。
ダウンロード数 21
リリース時間 : 7/27/2023

モデル概要

このモデルはwav2vec2のバリエーションで、キーワード検出タスクに特化しており、音声中の特定のコマンドワードを識別できます。

モデル特徴

ONNX形式のサポート
モデルはONNX形式に変換されており、Web環境での使用が容易です。
効率的なキーワード検出
音声中の特定のコマンドワードを識別するために特別に最適化されています。
Web互換性
Transformers.jsライブラリを通じてブラウザで直接実行できます。

モデル能力

音声コマンド認識
オーディオ分類
キーワード検出

使用事例

音声インタラクション
音声コマンド認識
ユーザーが発話した特定のコマンドワード(例:「上」「下」など)を識別します。
例では「下」コマンドの識別精度が99.98%に達します。
スマートホーム制御
音声でスマートホーム機器を制御するためのコマンド認識に使用します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase