A

Ast Finetuned Speech Commands V2

Xenovaによって開発
ASTアーキテクチャに基づく音声コマンド認識モデル、ウェブ展開向けに最適化されたONNXフォーマット版
ダウンロード数 15
リリース時間 : 6/27/2023

モデル概要

このモデルはMITが公開した音声コマンド認識モデルで、Audio Spectrogram Transformer (AST)アーキテクチャをファインチューニングし、Transformers.jsライブラリのウェブ展開要件に合わせてONNXフォーマットに変換されています

モデル特徴

ウェブ最適化
Transformers.jsに適合するようONNXフォーマットに変換され、ブラウザ環境で直接実行可能
軽量展開
エッジコンピューティングシナリオ向けに設計され、リソースが限られたクライアントアプリケーションに適しています
リアルタイム処理
音声コマンド認識シナリオ向けに最適化され、低遅延特性を備えています

モデル能力

音声コマンド認識
オーディオ分類
リアルタイム音声処理

使用事例

スマートホーム
音声制御デバイス
音声コマンドでスマートホームデバイスを制御
高精度な非接触制御を実現
アクセシビリティ技術
音声支援システム
身体が不自由なユーザー向けの音声インターフェースを提供
デバイス操作のハードルを低減
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase