wav2vec2-base-POSITIVE_NEGATIVE_ONLY_BALANCED_CLASSES オープンソース音声モデル

Wav2vec2 Base POSITIVE NEGATIVE ONLY BALANCED CLASSES

aherzbergによって開発

facebook/wav2vec2-baseを微調整した音声処理モデルで、バランス正負クラス分類タスクに特化

ダウンロード数 17

リリース時間 : 11/23/2022

モデル概要

このモデルはwav2vec2-baseをベースに微調整したバージョンで、主に音声関連の二値分類タスクに使用され、評価セットで88.22%の精度を達成

バランス正負クラス処理

分類タスクにおけるクラス不均衡問題に特化して最適化

高精度

評価セットで88.22%の分類精度を達成

wav2vec2アーキテクチャベース

成熟したwav2vec2-baseモデルを微調整し、優れた音声特徴抽出能力を有する

音声分類

二値分類タスク処理

不均衡データ分類

音声分析

音声感情分類

音声セグメントの感情傾向を判断

精度88.22%

音声コマンド認識

音声コマンドが特定のカテゴリに属するかどうかを識別