t5-base-finetuned-emotion開源模型 - 免費部署助力文本情感精準分類

首頁

T5 Base Finetuned Emotion

由mrm8488開發

該模型是基於谷歌T5-base模型在情感識別數據集上微調而成，用於文本情感分類任務，可將文本分類為6種基本情感。

文本分類英語#文本情感分析 #多情感分類 #T5微調模型

下載量 7,797

發布時間 : 3/2/2022

模型概述

使用T5-base架構微調的情感識別模型，能夠將輸入文本分類為悲傷、快樂、愛意、憤怒、恐懼或驚訝六種情感類別。

模型特點

多情感分類

能夠識別文本中表達的6種不同情感：悲傷、快樂、愛意、憤怒、恐懼和驚訝

基於T5架構

利用T5強大的文本理解能力進行情感分析，繼承了T5模型的優秀性能

高準確率

在測試集上整體準確率達到93%，部分情感類別F1值超過95%

模型能力

文本情感分析

情感分類

自然語言理解

使用案例

社交媒體分析

用戶評論情感分析

分析社交媒體上用戶評論的情感傾向

準確識別93%的情感類別

客戶服務

客戶反饋情感分類

自動分類客戶反饋中的情感傾向

憤怒和悲傷情感識別準確率超過92%

🚀 T5-base 微調用於情感識別 😂😢😡😃😯

本項目基於 Google 的 T5 基礎模型，在情感識別數據集上進行微調，以完成 情感識別 下游任務。

🚀 快速開始

from transformers import AutoTokenizer, AutoModelWithLMHead

tokenizer = AutoTokenizer.from_pretrained("mrm8488/t5-base-finetuned-emotion")

model = AutoModelWithLMHead.from_pretrained("mrm8488/t5-base-finetuned-emotion")

def get_emotion(text):
  input_ids = tokenizer.encode(text + '</s>', return_tensors='pt')

  output = model.generate(input_ids=input_ids,
               max_length=2)
  
  dec = [tokenizer.decode(ids) for ids in output]
  label = dec[0]
  return label
  
get_emotion("i feel as if i havent blogged in ages are at least truly blogged i am doing an update cute") # 輸出: 'joy'
 
get_emotion("i have a feeling i kinda lost my best friend") # 輸出: 'sadness'

✨ 主要特性

基於 Google 的 T5 基礎模型，在情感識別數據集上進行微調，可有效完成情感識別下游任務。
能夠將文本分類為 6 種不同的情感：悲傷 😢、喜悅 😃、愛 🥰、憤怒 😡、恐懼 😱、驚訝 😯。

📚 詳細文檔

T5 模型詳情

T5 模型由 Colin Raffel、Noam Shazeer、Adam Roberts、Katherine Lee、Sharan Narang、Michael Matena、Yanqi Zhou、Wei Li、Peter J. Liu 在論文 Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer 中提出。以下是論文摘要：

遷移學習是自然語言處理（NLP）中的一種強大技術，它先在數據豐富的任務上預訓練模型，然後在下游任務上進行微調。遷移學習的有效性催生了多種方法、方法論和實踐。在本文中，我們通過引入一個統一的框架，將每個語言問題轉化為文本到文本的格式，探索了 NLP 遷移學習技術的領域。我們的系統研究比較了預訓練目標、架構、無標籤數據集、遷移方法和其他因素在數十個語言理解任務上的表現。通過將我們的探索見解與規模和新的“Colossal Clean Crawled Corpus”相結合，我們在許多涵蓋摘要、問答、文本分類等的基準測試中取得了最先進的結果。為了促進未來 NLP 遷移學習的研究，我們發佈了數據集、預訓練模型和代碼。

模型圖片

下游任務（情感識別）詳情 - 數據集 📚

Elvis Saravia 收集了一個很棒的情感識別數據集，該數據集可以將文本分類為以下 6 種情感之一：

悲傷 😢
喜悅 😃
愛 🥰
憤怒 😡
恐懼 😱
驚訝 😯

模型微調 🏋️‍

訓練腳本是 Suraj Patil 創建的 Colab 筆記本的略微修改版本，所有功勞歸他！

測試集指標 🧾

屬性	詳情
模型類型	T5-base 微調用於情感識別
訓練數據	emotion 數據集

情感	精確率	召回率	F1 分數	樣本數
憤怒	0.93	0.92	0.93	275
恐懼	0.91	0.87	0.89	224
喜悅	0.97	0.94	0.95	695
愛	0.80	0.91	0.85	159
悲傷	0.97	0.97	0.97	521
驚訝	0.73	0.89	0.80	66
準確率			0.93	2000
宏平均	0.89	0.92	0.90	2000
加權平均	0.94	0.93	0.93	2000