Nusabert Base Indonesian Plutchik Emotion Analysis V2
EmoSense-IDはプラッチックの8つの基本感情に基づいてインドネシア語テキストの感情を識別・分析するモデルです。
ダウンロード数 31
リリース時間 : 7/11/2024
モデル概要
このモデルはNusaBERT-baseを使用して開発され、インドネシアのツイートデータを用いて8つの感情分類のトレーニングを行い、ソーシャルメディアの感情分析やユーザーの感情的反応の洞察に利用できます。
モデル特徴
プラッチック八基本感情分類
期待、怒り、嫌悪、恐怖、喜び、悲しみ、驚き、信頼の8つの基本感情を識別可能
インドネシア語専用モデル
インドネシア語テキストに最適化された感情分析モデル
ソーシャルメディア感情分析
インドネシアのソーシャルメディア上のユーザー感情反応の分析に特に適しています
モデル能力
インドネシア語テキスト感情分類
ソーシャルメディア感情分析
マルチラベル感情識別
使用事例
ソーシャルメディア分析
ツイート感情モニタリング
インドネシアのソーシャルメディア上のユーザー感情傾向を分析
8つの基本感情とその強度を識別可能
市場調査
製品フィードバック感情分析
インドネシア消費者製品に対する感情的反応を分析
🚀 EmoSense-ID
EmoSense-IDは、インドネシア語のテキストに含まれる感情を分析するモデルです。Plutchikの8つの基本感情に基づき、社会メディアの投稿などの感情分析に役立ちます。
🚀 クイックスタート
以下に、いくつかのサンプルテキストとその感情分析結果を示します。
{
"widget": [
{
"text": "Dih apaan banget dah buang sampah ke sungai begitu. Ada aktivis lingkungan yg sampe dipenjara karena menyuarakan peduli lingkungan. Ini pengangguran satu malah enak bener buang sampah sembarangan. Pantes lu susah, kelakuan lu nyusahin orang lain sih.",
"example_title": "Example 1",
"output": [
{
"label": "Disgust",
"score": 0.672
},
{
"label": "Anger",
"score": 0.282
},
{
"label": "Sadness",
"score": 0.033
},
{
"label": "Joy",
"score": 0.004
},
{
"label": "Surprise",
"score": 0.003
},
{
"label": "Trust",
"score": 0.003
},
{
"label": "Fear",
"score": 0.002
},
{
"label": "Anticipation",
"score": 0.001
}
]
},
{
"text": "Februari 2009, wartawan Jawa Pos Radar Bali dibunuh dengan keji karena berita korupsi. Januari 2019, Presiden memberikan grasi kepada otak pembunuhan Prabangsa, dari seumur hidup menjadi cuma 20 tahun penjara. Sebuah langkah mundur yang menyakitkan!",
"example_title": "Example 2",
"output": [
{
"label": "Sadness",
"score": 0.604
},
{
"label": "Anger",
"score": 0.194
},
{
"label": "Surprise",
"score": 0.127
},
{
"label": "Joy",
"score": 0.021
},
{
"label": "Fear",
"score": 0.018
},
{
"label": "Disgust",
"score": 0.018
},
{
"label": "Anticipation",
"score": 0.016
},
{
"label": "Trust",
"score": 0.003
}
]
},
{
"text": "Salut banget sama perjalanan hidup mereka ini kalo diproduksi jadi film pasti bakal rame dan menginspirasi banget woi",
"example_title": "Example 3",
"output": [
{
"label": "Joy",
"score": 0.9637
},
{
"label": "Trust",
"score": 0.0219
},
{
"label": "Anticipation",
"score": 0.0079
},
{
"label": "Surprise",
"score": 0.0029
},
{
"label": "Disgust",
"score": 0.0013
},
{
"label": "Sadness",
"score": 0.0010
},
{
"label": "Anger",
"score": 0.0007
},
{
"label": "Fear",
"score": 0.0006
}
]
},
{
"text": "SUMPAH HARUS DIBEBASKAN!!! KENAPA GAK TANGKEPIN KORUPTOR AJA DARIPADA NGURUSIN MEME DARI AI GW MARAH BANGET SHIBAL",
"example_title": "Example 4",
"output": [
{
"label": "Anger",
"score": 0.9889
},
{
"label": "Disgust",
"score": 0.0035
},
{
"label": "Sadness",
"score": 0.0026
},
{
"label": "Fear",
"score": 0.0015
},
{
"label": "Surprise",
"score": 0.0012
},
{
"label": "Trust",
"score": 0.0011
},
{
"label": "Anticipation",
"score": 0.0009
},
{
"label": "Joy",
"score": 0.0003
}
]
},
{
"text": "ga pernah pacaran, sekarang hidup kesepian bgt. pengen minta kenalin cowo ke temen tp mereka jg sama struggle nya. jd nyesel dulu pas sekolah-kuliah kenapa ga pernah 'macem2'",
"example_title": "Example 5",
"output": [
{
"label": "Sadness",
"score": 0.9526
},
{
"label": "Anger",
"score": 0.0175
},
{
"label": "Fear",
"score": 0.0114
},
{
"label": "Disgust",
"score": 0.0079
},
{
"label": "Trust",
"score": 0.0038
},
{
"label": "Anticipation",
"score": 0.0036
},
{
"label": "Joy",
"score": 0.0019
},
{
"label": "Surprise",
"score": 0.0013
}
]
},
{
"text": "Komisi Penyiaran Indonesia (KPI) meminta agar tayangan televisi menampilkan citra positif Polri secara edukatif dan akurat. Hal ini disampaikan ketua KPI Pusat Ubaidillah dalam sebuah diskusi panel",
"example_title": "Example 6",
"output": [
{
"label": "Anticipation",
"score": 0.4323
},
{
"label": "Trust",
"score": 0.3996
},
{
"label": "Joy",
"score": 0.0500
},
{
"label": "Anger",
"score": 0.0388
},
{
"label": "Disgust",
"score": 0.0362
},
{
"label": "Surprise",
"score": 0.0186
},
{
"label": "Fear",
"score": 0.0137
},
{
"label": "Sadness",
"score": 0.0108
}
]
}
],
"library_name": "transformers",
"license": "mit",
"language": [
"id"
]
}
📚 ドキュメント
モデルの詳細
モデルの説明
EmoSense-IDは、Plutchikの8つの基本感情(期待、怒り、嫌悪、恐怖、喜び、悲しみ、驚き、信頼)に基づき、インドネシア語のテキストの感情を識別・分析するモデルです。このモデルは、NusaBERT-base をベースに開発され、インドネシア語のツイートを8つの感情カテゴリに分類したデータセットで学習されています。モデルの評価結果は、ソーシャルメディアの感情分析に利用でき、ユーザーの感情反応に関する洞察を提供します。
バイアス
このモデルは特定のデータセットで学習されているため、感情分類の過程でバイアスが生じる可能性があります。そのため、このモデルを使用する際には、そのようなバイアスを考慮することが重要です。
評価結果
このモデルは、Optunaを用いたハイパーパラメータチューニング技術で学習されました。Optunaは、学習率(1e-6から1e-4)と重み減衰(1e-6から1e-2)の最適な組み合わせを決定するために5回の試行を行いました。各試行では、異なるハイパーパラメータ設定でBERTモデルを学習データセットで学習させ、検証データセットで評価しました。すべての実験が完了した後、最適なハイパーパラメータの組み合わせを使用して最終的なモデルを学習させました。
エポック | 学習損失 | 検証損失 | 正解率 | F1値 | 適合率 | 再現率 |
---|---|---|---|---|---|---|
1 | 0.758400 | 0.583508 | 0.829932 | 0.830203 | 0.833136 | 0.829932 |
2 | 0.370100 | 0.394630 | 0.866213 | 0.865496 | 0.870364 | 0.866213 |
3 | 0.231500 | 0.355294 | 0.884354 | 0.884585 | 0.888140 | 0.884354 |
4 | 0.071000 | 0.322376 | 0.902494 | 0.902801 | 0.904842 | 0.902494 |
5 | 0.129900 | 0.308596 | 0.900227 | 0.900340 | 0.902132 | 0.900227 |
📄 ライセンス
このモデルはMITライセンスの下で提供されています。
📖 引用
@misc{Ardiyanto_Mikhael_2024,
author = {Mikhael Ardiyanto},
title = {EmoSense-ID},
year = {2024},
URL = {Aardiiiiy/EmoSense-ID-Indonesian-Emotion-Classifier},
publisher = {Hugging Face}
}
Distilbert Base Uncased Finetuned Sst 2 English
Apache-2.0
DistilBERT - base - uncasedをベースに、SST - 2感情分析データセットで微調整されたテキスト分類モデル。正解率91.3%
テキスト分類 英語
D
distilbert
5.2M
746
Xlm Roberta Base Language Detection
MIT
XLM-RoBERTaベースの多言語検出モデル、20言語のテキスト分類をサポート
テキスト分類
Transformers 複数言語対応

X
papluca
2.7M
333
Roberta Hate Speech Dynabench R4 Target
このモデルは動的データセット生成を通じてオンライン憎悪検出を改善し、検出効果を高めるために最悪ケースから学習することに焦点を当てています。
テキスト分類
Transformers 英語

R
facebook
2.0M
80
Bert Base Multilingual Uncased Sentiment
MIT
bert-base-multilingual-uncasedを微調整した多言語感情分析モデルで、6言語の商品レビューの感情分析に対応しています。
テキスト分類 複数言語対応
B
nlptown
1.8M
371
Emotion English Distilroberta Base
DistilRoBERTa-baseをファインチューニングした英語テキストの感情分類モデルで、エクマンの6基本感情と中立カテゴリを予測可能。
テキスト分類
Transformers 英語

E
j-hartmann
1.1M
402
Robertuito Sentiment Analysis
RoBERTuitoベースのスペイン語ツイート感情分析モデル、POS(ポジティブ)/NEG(ネガティブ)/NEU(ニュートラル)の3分類に対応
テキスト分類 スペイン語
R
pysentimiento
1.0M
88
Finbert Tone
FinBERTは金融通信テキストを元に事前学習されたBERTモデルで、金融自然言語処理分野に特化しています。finbert-toneはその微調整バージョンで、金融感情分析タスクに使用されます。
テキスト分類
Transformers 英語

F
yiyanghkust
998.46k
178
Roberta Base Go Emotions
MIT
RoBERTa-baseに基づく多ラベル感情分類モデルで、go_emotionsデータセットで訓練され、28種類の感情ラベル識別をサポートします。
テキスト分類
Transformers 英語

R
SamLowe
848.12k
565
Xlm Emo T
XLM-EMOはXLM-Tモデルをファインチューニングした多言語感情分析モデルで、19言語をサポートし、特にソーシャルメディアテキストの感情予測に特化しています。
テキスト分類
Transformers その他

X
MilaNLProc
692.30k
7
Deberta V3 Base Mnli Fever Anli
MIT
MultiNLI、Fever-NLI、ANLIのデータセットを用いて訓練されたDeBERTa-v3モデルで、ゼロショット分類と自然言語推論タスクに優れています。
テキスト分類
Transformers 英語

D
MoritzLaurer
613.93k
204
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98