V

Voc2vec

alkiskoudounasによって開発
voc2vecは非言語人間データ専用に設計された基礎モデルで、wav2vec 2.0フレームワークを基に構築されており、事前学習データセットには約125時間の非言語音声が含まれています。
ダウンロード数 223
リリース時間 : 2/6/2025

モデル概要

voc2vecは非言語人間音声データ用の基礎モデルで、主に音声分類タスクに使用され、特に乳児の泣き声などの非言語発声の分類と分析に適しています。

モデル特徴

非言語発声分類
乳児の泣き声、笑い声などの非言語人間音声データに特化して設計されています。
複数データセット事前学習
10の異なるデータセットの集合を使用して事前学習を行い、約125時間の非言語音声をカバーしています。
複数バリエーションモデル
AudioSet、LibriSpeech、HuBERTなど、異なる事前学習データセットに基づくモデルバリエーションを提供しています。

モデル能力

非言語発声分類
音響特徴抽出
乳児の泣き声認識

使用事例

医療健康
乳児の泣き声分析
乳児の泣き声を分析し、乳児の要求や健康状態を識別するのに役立ちます。
Donate a Cryデータセットで良好な性能を示しました。
音声研究
非言語発声研究
人間の非言語発声の特徴やパターンを研究するために使用されます。
複数の非言語発声データセットで評価されました。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase