hebEMO_angerオープンソース感情検出ツール - ヘブライ語のコンテンツの感情極性を無料で検出し、感情を抽出する

ホーム

Hebemo Anger

avichrによって開発

HebEMOは、現代ヘブライ語のユーザー生成コンテンツ（UGC）の感情極性を検出し、感情を抽出するためのツールで、独自のCOVID-19関連データセットに基づいて訓練されています。

テキスト分類

Transformers

#ヘブライ語感情分析 #多感情認識 #ニュースコメント処理

ダウンロード数 117

リリース時間 : 3/2/2022

モデル概要

HebEMOは、ヘブライ語テキストの感情極性（ポジティブ/ニュートラル/ネガティブ）と8つの基本感情（怒り、嫌悪、期待、恐怖、喜び、悲しみ、驚き、信頼）を識別でき、ソーシャルメディアコメントなどのユーザー生成コンテンツの感情分析に適しています。

モデル特徴

高性能感情分析

感情極性分類タスクで加重平均F1スコア0.96の優れた性能を達成

多感情認識

8つの基本感情を同時に検出可能で、大半の感情でF1スコア0.78-0.97を達成

専門データセット

独自のCOVID-19パンデミック期間中のイスラエルニュースサイトコメントデータセットに基づき訓練され、35万文を含む

使いやすさ

Hugging FaceデモとColabノートブックを提供し、迅速なデプロイをサポート

モデル能力

ヘブライ語テキスト感情分析

多感情同時検出

ユーザー生成コンテンツ分析

ソーシャルメディアコメント感情認識

使用事例

ソーシャルメディア分析

ニュースコメント感情モニタリング

ニュースサイトのユーザーコメントの感情傾向を分析

特定のトピックに対する一般の感情的反応を識別可能

市場調査

製品フィードバック分析

ヘブライ語ユーザーの製品評価感情を分析

消費者の満足度と主要な感情的反応を識別

🚀 HebEMO - 現代ヘブライ語の感情認識モデル

HebEMOは、現代ヘブライ語のユーザー生成コンテンツ（UGC）から極性を検出し、感情を抽出するツールです。このモデルは、独自に収集し注釈付けしたCOVID - 19関連のデータセットで学習されています。

HebEMOは、極性分類において加重平均F1スコア = 0.96という高い性能を示しました。感情検出では、驚きを除いてF1スコアが0.78 - 0.97に達しました（驚きのF1スコアは0.41）。これらの結果は、英語の場合と比較しても、報告されている最高性能を上回っています。

✨ 主な機能

HebEMOは、現代ヘブライ語のUGCから極性と感情を高精度に検出します。独自のCOVID - 19関連データセットで学習されており、高い性能を発揮します。

📚 ドキュメント

感情UGCデータの説明

当社のUGCデータには、2020年1月から2020年8月までに、3つの主要なイスラエルのニュースサイトから収集されたニュース記事へのコメントが含まれています。データの総サイズは約150MBで、700万語以上、35万文を含んでいます。

約2000文が、クラウドメンバー（文あたり3 - 10人の注釈付け者）によって、全体的な感情（極性）と8つの感情（怒り、嫌悪、期待、恐怖、喜び、悲しみ、驚き、信頼）について注釈付けされました。各感情が出現した文の割合は、以下の表に示されています。

	怒り	嫌悪	期待	恐怖	喜び	悲しみ	驚き	信頼	感情
割合	0.78	0.83	0.58	0.45	0.12	0.59	0.17	0.11	0.25

性能

感情認識

感情	F1スコア	適合率	再現率
怒り	0.96	0.99	0.93
嫌悪	0.97	0.98	0.96
期待	0.82	0.80	0.87
恐怖	0.79	0.88	0.72
喜び	0.90	0.97	0.84
悲しみ	0.90	0.86	0.94
驚き	0.40	0.44	0.37
信頼	0.83	0.86	0.80

上記の指標は、肯定クラス（つまり、感情がテキストに反映されている場合）のものです。

感情分析（極性のみ）

	適合率	再現率	F1スコア
中立	0.83	0.56	0.67
肯定	0.96	0.92	0.94
否定	0.97	0.99	0.98
正解率			0.97
マクロ平均	0.92	0.82	0.86
加重平均	0.96	0.97	0.96

感情（極性）分析モデルはAWSでも利用可能です！詳細についてはAWSのgitを参照してください。

💻 使用例

感情認識モデル

オンラインモデルは、huggingface spaces または colab notebook で見つけることができます。

# !pip install pyplutchik==0.0.7
# !pip install transformers==4.14.1

!git clone https://github.com/avichaychriqui/HeBERT.git
from HeBERT.src.HebEMO import *
HebEMO_model = HebEMO()

HebEMO_model.hebemo(input_path = 'data/text_example.txt')
# return analyzed pandas.DataFrame  

hebEMO_df = HebEMO_model.hebemo(text='החיים יפים ומאושרים', plot=True)

感情分類モデル（極性のみ）

from transformers import AutoTokenizer, AutoModel, pipeline

tokenizer = AutoTokenizer.from_pretrained("avichr/heBERT_sentiment_analysis") #same as 'avichr/heBERT' tokenizer
model = AutoModel.from_pretrained("avichr/heBERT_sentiment_analysis")

# how to use?
sentiment_analysis = pipeline(
    "sentiment-analysis",
    model="avichr/heBERT_sentiment_analysis",
    tokenizer="avichr/heBERT_sentiment_analysis",
    return_all_scores = True
)

sentiment_analysis('אני מתלבט מה לאכול לארוחת צהריים')	
# >>>  [[{'label': 'neutral', 'score': 0.9978172183036804},
# >>>  {'label': 'positive', 'score': 0.0014792329166084528},
# >>>  {'label': 'negative', 'score': 0.0007035882445052266}]]

sentiment_analysis('קפה זה טעים')
# >>>  [[{'label': 'neutral', 'score': 0.00047328314394690096},
# >>>  {'label': 'possitive', 'score': 0.9994067549705505},
# >>>  {'label': 'negetive', 'score': 0.00011996887042187154}]]

sentiment_analysis('אני לא אוהב את העולם')
# >>>  [[{'label': 'neutral', 'score': 9.214012970915064e-05}, 
# >>>  {'label': 'possitive', 'score': 8.876807987689972e-05}, 
# >>>  {'label': 'negetive', 'score': 0.9998190999031067}]]

📄 ライセンス

このモデルを使用した場合は、以下のように引用してください。 Chriqui, A., & Yahav, I. (2022). HeBERT & HebEMO: a Hebrew BERT Model and a Tool for Polarity Analysis and Emotion Recognition. INFORMS Journal on Data Science, forthcoming.

@article{chriqui2021hebert,
  title={HeBERT \& HebEMO: a Hebrew BERT Model and a Tool for Polarity Analysis and Emotion Recognition},
  author={Chriqui, Avihay and Yahav, Inbal},
  journal={INFORMS Journal on Data Science},
  year={2022}
}