hebEMO_sadness開源情感檢測工具 - 免費檢測希伯來語UGC情感極性

首頁

Hebemo Sadness

由avichr開發

HebEMO是一款用於檢測極性並從現代希伯來語用戶生成內容(UGC)中提取情感的工具

文本分類

Transformers

#希伯來語情感分析 #高精度極性檢測 #新聞評論處理

下載量 108

發布時間 : 3/2/2022

模型概述

HebEMO是一個基於BERT的希伯來語情感分析模型，能夠識別文本中的情感極性和八種基本情緒（憤怒、厭惡、期待、恐懼、快樂、悲傷、驚訝和信任）。該模型在希伯來語情感分析任務中表現出色，特別是在極性分類方面達到了0.96的加權平均F1分數。

模型特點

高精度情感極性分析

在極性分類任務中達到加權平均F1分數0.96的優異表現

多情緒識別

能夠識別八種基本情緒，除驚訝外其他情緒的F1分數均在0.78-0.97之間

針對希伯來語優化

專門針對現代希伯來語用戶生成內容進行訓練和優化

大規模訓練數據

基於包含700餘萬詞和35萬句的希伯來語新聞評論數據集訓練

模型能力

文本情感極性分析（積極/消極/中立）

多情緒識別（八種基本情緒）

希伯來語自然語言處理

用戶生成內容分析

使用案例

社交媒體分析

新聞評論情感分析

分析希伯來語新聞網站評論中的用戶情感傾向

可準確識別評論中的情感極性和具體情緒

市場研究

產品評價分析

分析希伯來語用戶對產品或服務的評價情感

幫助瞭解消費者對產品的情緒反應

🚀 HebEMO - 現代希伯來語情感識別模型

HebEMO 是一款用於檢測現代希伯來語用戶生成內容（UGC）情感極性並提取情感的工具。該模型基於我們收集並標註的獨特新冠疫情相關數據集進行訓練。

HebEMO 在極性分類任務中取得了加權平均 F1 分數為 0.96 的優異成績。在情感檢測方面，除“驚訝”情感（F1 分數為 0.41，模型未能很好地捕捉該情感）外，其他情感的 F1 分數達到了 0.78 - 0.97。即使與英語模型相比，這些結果也優於目前已報道的最佳性能。

✨ 主要特性

能夠對現代希伯來語用戶生成內容進行情感極性檢測和情感提取。
在極性分類和多數情感檢測任務中表現出色。

📚 詳細文檔

情感用戶生成內容數據描述

我們的用戶生成內容數據包含了從 2020 年 1 月至 2020 年 8 月期間，以色列 3 家主要新聞網站上新聞文章的評論。數據總大小約為 150 MB，包含超過 700 萬個單詞和 35 萬條句子。

約 2000 條句子由眾包人員（每條句子有 3 - 10 名標註人員）進行標註，標註內容包括整體情感傾向（極性）和八種情感：憤怒、厭惡、期待、恐懼、喜悅、悲傷、驚訝和信任。

每種情感在句子中出現的比例如下表所示：

屬性	詳情
憤怒	0.78
厭惡	0.83
期待	0.58
恐懼	0.45
喜悅	0.12
悲傷	0.59
驚訝	0.17
信任	0.11
情感傾向	0.25

性能表現

情感識別

情感	F1 分數	精確率	召回率
憤怒	0.96	0.99	0.93
厭惡	0.97	0.98	0.96
期待	0.82	0.80	0.87
恐懼	0.79	0.88	0.72
喜悅	0.90	0.97	0.84
悲傷	0.90	0.86	0.94
驚訝	0.40	0.44	0.37
信任	0.83	0.86	0.80

以上指標針對正類（即文本中反映出該情感）。

情感傾向（極性）分析

類別	精確率	召回率	F1 分數
中性	0.83	0.56	0.67
積極	0.96	0.92	0.94
消極	0.97	0.99	0.98
準確率	-	-	0.97
宏平均	0.92	0.82	0.86
加權平均	0.96	0.97	0.96

情感傾向（極性）分類模型也可在 AWS 上使用！更多信息請訪問 AWS 的 GitHub 倉庫。

💻 使用示例

基礎用法

情感識別模型

可以在 Hugging Face Spaces 上找到在線模型，也可以使用 Colab 筆記本。

# !pip install pyplutchik==0.0.7
# !pip install transformers==4.14.1

!git clone https://github.com/avichaychriqui/HeBERT.git
from HeBERT.src.HebEMO import *
HebEMO_model = HebEMO()

HebEMO_model.hebemo(input_path = 'data/text_example.txt')
# return analyzed pandas.DataFrame  

hebEMO_df = HebEMO_model.hebemo(text='החיים יפים ומאושרים', plot=True)

示例圖片

情感分類模型（僅極性）

from transformers import AutoTokenizer, AutoModel, pipeline

tokenizer = AutoTokenizer.from_pretrained("avichr/heBERT_sentiment_analysis") #same as 'avichr/heBERT' tokenizer
model = AutoModel.from_pretrained("avichr/heBERT_sentiment_analysis")

# how to use?
sentiment_analysis = pipeline(
    "sentiment-analysis",
    model="avichr/heBERT_sentiment_analysis",
    tokenizer="avichr/heBERT_sentiment_analysis",
    return_all_scores = True
)

sentiment_analysis('אני מתלבט מה לאכול לארוחת צהריים')	
>>>  [[{'label': 'neutral', 'score': 0.9978172183036804},
>>>  {'label': 'positive', 'score': 0.0014792329166084528},
>>>  {'label': 'negative', 'score': 0.0007035882445052266}]]

sentiment_analysis('קפה זה טעים')
>>>  [[{'label': 'neutral', 'score': 0.00047328314394690096},
>>>  {'label': 'possitive', 'score': 0.9994067549705505},
>>>  {'label': 'negetive', 'score': 0.00011996887042187154}]]

sentiment_analysis('אני לא אוהב את העולם')
>>>  [[{'label': 'neutral', 'score': 9.214012970915064e-05}, 
>>>  {'label': 'possitive', 'score': 8.876807987689972e-05}, 
>>>  {'label': 'negetive', 'score': 0.9998190999031067}]]

📄 許可證

文檔中未提及相關許可證信息。

🔗 聯繫我們

Avichay Chriqui
Inbal yahav
The Coller Semitic Languages AI Lab

感謝使用！ תודה， شكرا

📝 引用說明

如果您使用了此模型，請按以下格式引用我們的工作： Chriqui, A., & Yahav, I. (2022). HeBERT & HebEMO: a Hebrew BERT Model and a Tool for Polarity Analysis and Emotion Recognition. INFORMS Journal on Data Science, forthcoming.

@article{chriqui2021hebert,
  title={HeBERT \& HebEMO: a Hebrew BERT Model and a Tool for Polarity Analysis and Emotion Recognition},
  author={Chriqui, Avihay and Yahav, Inbal},
  journal={INFORMS Journal on Data Science},
  year={2022}
}