Ser Model Fixed Label

S

Ser Model Fixed Label

aherzbergによって開発

facebook/wav2vec2-baseをファインチューニングした音声感情認識モデルで、評価データセットで83.67%の精度を達成

オープンソースライセンス:Apache-2.0 #音声感情認識 #wav2vec2ファインチューニング #高精度

ダウンロード数 18

リリース時間 : 2/28/2023

モデル概要

このモデルはwav2vec2アーキテクチャに基づく音声感情認識モデルで、音声から感情カテゴリを識別します

モデル特徴

高精度

評価データセットで83.67%の精度を達成

wav2vec2アーキテクチャ採用

facebookのwav2vec2-baseをベースモデルとして使用

エンドツーエンド学習

複雑な特徴量エンジニアリングなしで生の音声入力を直接処理

モデル能力

音声感情認識

音声分類

使用事例

感情分析

コールセンター音声分析

コールセンター通話における顧客の感情状態を分析

83.67%の感情カテゴリを識別可能

メンタルヘルス評価

音声を通じてユーザーの情緒状態を分析

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase