S

Speechcommand Demo

SHENMU007によって開発
facebook/wav2vec2-baseをファインチューニングした音声コマンド分類モデル、superbデータセットでトレーニングされ、精度98.09%を達成
ダウンロード数 18
リリース時間 : 5/23/2023

モデル概要

このモデルは音声コマンド分類タスク向けに最適化された深層学習モデルで、音声指令を正確に認識・分類できます

モデル特徴

高精度
評価データセットで98.09%の精度を達成
wav2vec2アーキテクチャ採用
facebook/wav2vec2-baseをベースモデルとしてファインチューニング
効率的なトレーニング
混合精度トレーニングと勾配蓄積技術でトレーニング効率を最適化

モデル能力

音声コマンド分類
オーディオ特徴量抽出
音声指令認識

使用事例

スマートホーム制御
音声制御デバイス
ユーザーの音声指令を認識してスマートホームデバイスを制御
一般的な制御コマンドを高精度で認識
音声アシスタント
基本コマンド認識
音声アシスタントに基本的なコマンド認識機能を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase