W

Wav2vec2 Base Finetuned Ks

Dc26によって開発
facebook/wav2vec2-baseモデルをspeech_commandsデータセットでファインチューニングした音声認識モデルで、精度は97.8%を達成
ダウンロード数 23
リリース時間 : 3/25/2023

モデル概要

このモデルは音声コマンド認識用のファインチューニングモデルで、wav2vec2アーキテクチャに基づき、キーワード検出タスクに適しています

モデル特徴

高精度
評価データセットで97.8%の精度を達成
wav2vec2アーキテクチャ採用
強力なwav2vec2-baseをベースモデルとして使用
軽量なファインチューニング
少量のトレーニングデータで良好な性能を実現

モデル能力

音声コマンド認識
キーワード検出
音声分類

使用事例

スマートホーム
音声制御デバイス
ユーザーの音声コマンドを認識してスマートホームデバイスを制御
一般的な制御コマンドを正確に認識
ウェアラブルデバイス
音声アシスタント
リソース制約のあるデバイスで基本的な音声インタラクション機能を実現
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase