A

Ast Finetuned Speech Commands V2

由Xenova開發
基於AST架構的語音命令識別模型,專為網頁端部署優化的ONNX格式版本
下載量 15
發布時間 : 6/27/2023

模型概述

該模型是MIT發佈的語音命令識別模型,基於Audio Spectrogram Transformer (AST)架構微調,轉換為ONNX格式以適配Transformers.js庫的網頁端部署需求

模型特點

網頁端優化
轉換為ONNX格式以適配Transformers.js,支持瀏覽器環境直接運行
輕量級部署
專為邊緣計算場景設計,適合資源受限的客戶端應用
即時處理
針對語音命令識別場景優化,具備低延遲特性

模型能力

語音命令識別
音頻分類
即時語音處理

使用案例

智能家居
語音控制設備
通過語音命令控制智能家居設備
實現高準確率的免接觸控制
無障礙技術
語音輔助系統
為行動不便用戶提供語音交互界面
降低設備操作門檻
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase