W

Wav2vec2 Large Nonverbalvocalization Classification

padmalcomによって開発
wav2vec2アーキテクチャに基づく多言語非言語発声分類モデル、16種類の一般的な非言語音声を識別可能
ダウンロード数 568
リリース時間 : 1/9/2023

モデル概要

このモデルは咳、あくび、ため息などの非言語発声を分類するために特別に設計されており、音声分析シナリオに適しています

モデル特徴

多言語サポート
モデルは特定の言語に依存せず、様々な言語環境での非言語発声を処理可能
幅広い音声カテゴリ
16種類の一般的な非言語発声の分類をサポートし、日常生活の様々な音声をカバー
wav2vec2アーキテクチャ採用
先進的なwav2vec2-largeアーキテクチャを活用し、高品質な音声特徴抽出と分類能力を提供

モデル能力

非言語音声認識
音声分類
多言語音声処理

使用事例

健康モニタリング
睡眠品質分析
歯ぎしり、あくびなどの音声を検出して睡眠品質を評価
呼吸健康モニタリング
咳、喘鳴などの音声を識別し呼吸健康評価を支援
感情分析
感情状態識別
ため息、泣き声などの音声を通じてユーザーの感情状態を分析
スマートホーム
環境音認識
家庭環境内の様々な非言語音声を識別しスマート制御を実現
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase