Whisper Large V3 Msp Podcast Emotion
Whisper-Large V3を基にした音声感情認識モデルで、MSP-Podcastデータセットに最適化されており、9種類の感情分類をサポート
音声分類
Safetensors 英語
W
tiantiaf
282
3
Ast Finetuned Model
Apache-2.0
これはオーディオスペクトログラムトランスフォーマー(AST)ベースのファインチューニングモデルで、音声オーディオの感情分類に特化しています。
音声分類
Transformers 英語

A
forwarder1121
174
0
Wavlm Large Finetuned SER
WavLM-Largeベースの音声感情認識モデルで、英語音声の感情分類をサポートします。
音声分類 英語
W
JBJoyce
139
0
Speech Emotion Recognition With Openai Whisper Large V3
Apache-2.0
本プロジェクトではWhisperモデルを利用して音声感情認識を実現し、音声を喜び、悲しみ、驚きなどの異なる感情カテゴリに分類することができます。
音声分類
Transformers

S
firdhokk
7,750
33
Speechbrain Emotion Recognition Openvino
Apache-2.0
このモデルはファインチューニングされたwav2vec2(ベース)アーキテクチャを使用し、IEMOCAPデータセットでトレーニングされ、音声感情認識タスクに用いられます。
音声分類 英語
S
psakamoori
13
0
SER Odyssey Baseline WavLM Categorical
MIT
WavLMアーキテクチャに基づく音声感情認識のベースラインモデル、8つの基本感情カテゴリを予測
音声分類
Transformers 英語

S
3loi
581
8
Speech Emotion Recognition Wav2vec2 Large Xlsr 53 240304 SER Fine Tuned2.0
Apache-2.0
wav2vec2-large-xlsr-53ベースの音声感情認識モデル、7種類の感情分類に対応
音声分類
Transformers

S
hughlan1214
145
2
Wav2vec2 Large Xlsr 53 English Finetuned Ravdess
Apache-2.0
wav2vec2-large-xlsr-53-englishモデルをRAVDESSデータセットでファインチューニングした音声感情認識モデル
音声分類
Transformers

W
firdho26
68
0
Wav2vec2 Audio Emotion Classification
Apache-2.0
facebook/wav2vec2-baseを微調整した音声感情分類モデルで、音声中の感情状態を分析するために使用されます
音声分類
Transformers

W
dhanush23
15
0
Wav2vec2 Audio Emotion Classification
Apache-2.0
facebook/wav2vec2-baseをファインチューニングした音声感情分類モデルで、評価セットで73.98%の精度を達成
音声分類
Transformers

W
chin-may
77
5
Wav2vec2 Lg Xlsr En Speech Emotion Recognition Finetuned Ravdess V8
Apache-2.0
wav2vec2アーキテクチャに基づく英語音声感情認識モデル、RAVDESSデータセットで微調整
音声分類
Transformers

W
Wiam
94
4
Emotion Diarization Wavlm Large
Apache-2.0
WavLM Largeモデルをファインチューニングし、音声感情認識と話者ログ分析に使用され、複数の感情分類をサポート
音声分類 英語
E
speechbrain
1,128
52
Distilhubert Finetuned Ravdess
Apache-2.0
DistilHuBERTアーキテクチャを基にRAVDESS音声感情データセットでファインチューニングされた音声感情認識モデル、精度92.36%
音声分類
Transformers

D
pollner
43
2
Finetuned Wav2vec2.0 Base On IEMOCAP 2
Apache-2.0
これはfacebook/wav2vec2-baseモデルをIEMOCAPデータセットでファインチューニングした音声感情認識モデルで、評価セットで73.9%の精度を達成しました。
音声分類
Transformers

F
minoosh
32
2
CREMA D Model
Apache-2.0
facebook/wav2vec2-baseをファインチューニングした音声感情認識モデルで、評価データセットで73.22%の精度を達成
音声分類
Transformers

C
jdmartinev
21
0
Wav2vec2 Base Toronto Emotional Speech Set
Apache-2.0
wav2vec2-baseを微調整した音声感情分類モデルで、話者の感情状態を識別するために使用されます。
音声分類
Transformers 英語

W
DunnBC22
185
3
Astie Finetuned On Shemo
Bsd-3-clause
このモデルはshEMOデータセットでASTモデルをファインチューニングしたバージョンで、主に音声感情認識タスクに使用されます。
音声分類
Transformers

A
minoosh
24
0
Iewav2vec2 Finetuned On Shemo
Apache-2.0
このモデルはminoosh/wav2vec2-base-finetuned-ieをshEMOデータセットでファインチューニングしたバージョンで、主に音声感情認識タスクに使用されます。
音声分類
Transformers

I
minoosh
20
0
Ser Model Adjusted 2023 03 03
Apache-2.0
facebook/wav2vec2-baseをファインチューニングした音声感情認識モデルで、評価セットで75.73%の精度を達成
音声分類
Transformers

S
aherzberg
18
0
Ser Model Fixed Label
Apache-2.0
facebook/wav2vec2-baseをファインチューニングした音声感情認識モデルで、評価データセットで83.67%の精度を達成
音声分類
Transformers

S
aherzberg
18
1
Ser Model
Apache-2.0
facebook/wav2vec2-baseをファインチューニングした音声感情認識モデルで、評価データセットで84.71%の精度を達成
音声分類
Transformers

S
aherzberg
30
0
Wav2vec2 Base Finetuned Sentiment Mesd
Apache-2.0
facebook/wav2vec2-baseをMESDデータセットでファインチューニングしたスペイン語オーディオ感情分類モデル
音声分類
Transformers

W
somosnlp-hackathon-2022
28
5
Xlsr Wav2vec Speech Emotion Recognition
Apache-2.0
XLSR-Wav2Vecアーキテクチャに基づく音声感情認識モデルで、怒り、嫌悪、恐怖、喜び、悲しみの5つの基本的な感情を認識できます。
音声分類
Transformers 英語

X
harshit345
498
62
Wav2vec2 Base Superb Er
Apache-2.0
これはWav2Vec2アーキテクチャに基づく音声感情認識モデルで、S3PRLプロジェクトから移植され、音声中の感情カテゴリを識別します。
音声分類
Transformers 英語

W
superb
28.14k
11
Wav2vec2 Lg Xlsr En Speech Emotion Recognition
Apache-2.0
Wav2Vec 2.0をファインチューニングした音声感情認識モデルで、8種類の英語感情を識別可能、RAVDESSデータセットで82.23%の精度を達成
音声分類
Transformers

W
ehcalabres
39.83k
221
Wav2vec2 Large Superb Er
Apache-2.0
これはWav2Vec2-Largeモデルに基づく感情認識モデルで、音声から感情カテゴリーを識別するために特別に設計されています。
音声分類
Transformers 英語

W
superb
1,442
1
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98