wav2vec2-base-superb-ksオープンソース音声分類モデル - 無料でのデプロイでキーワード検出タスクをサポート

ホーム

Wav2vec2 Base Superb Ks

Xenovaによって開発

wav2vec2アーキテクチャに基づくオーディオ分類モデルで、キーワード検出タスクに適しています。

音声分類

Transformers

#音声指令分類 #ONNX形式 #ウェブサイト端の適合

ダウンロード数 21

リリース時間 : 7/27/2023

モデル概要

このモデルはwav2vec2のバリエーションで、キーワード検出タスクに特化しており、音声中の特定のコマンドワードを識別できます。

モデル特徴

ONNX形式のサポート

モデルはONNX形式に変換されており、Web環境での使用が容易です。

効率的なキーワード検出

音声中の特定のコマンドワードを識別するために特別に最適化されています。

Web互換性

Transformers.jsライブラリを通じてブラウザで直接実行できます。

モデル能力

音声コマンド認識

オーディオ分類

キーワード検出

使用事例

音声インタラクション

音声コマンド認識

ユーザーが発話した特定のコマンドワード（例：「上」「下」など）を識別します。

例では「下」コマンドの識別精度が99.98%に達します。

スマートホーム制御

音声でスマートホーム機器を制御するためのコマンド認識に使用します。

属性	详情
ベースモデル	superb/wav2vec2-base-superb-ks
ライブラリ名	transformers.js

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Wav2vec2 Base Superb Ks

モデル概要

モデル特徴

モデル能力

使用事例

🚀 音声分類モデル（wav2vec2-base-superb-ks）

🚀 クイックスタート

📦 インストール

💻 使用例

基本的な使用法

注意事項