bert-multilingual-go-emtions開源模型 - 支持中英文本28種情感類別分類

首頁

Bert Multilingual Go Emtions

由SchuylerH開發

基於GoEmotions數據集進行跨語言情感分類的微調BERT模型，支持英文和中文文本，能分類28種情感類別。

文本分類

Transformers

支持多種語言開源協議:Apache-2.0 #多語言情感分析 #28類細粒度分類 #中英混合訓練

下載量 929

發布時間 : 7/25/2023

模型概述

該模型是一個多語言情感分析模型，能夠將輸入的英文或中文文本分類為28種不同的情感類別，包括欽佩、娛樂、憤怒、愛等。

模型特點

多語言支持

能夠處理英文和中文文本的情感分析任務

細粒度情感分類

將文本分類為28種不同的情感類別，提供更精細的情感分析

高準確率

在驗證集上達到85.95%的準確率和90.17%的F1分數

模型能力

英文情感分析

中文情感分析

多標籤情感分類

使用案例

社交媒體分析

用戶評論情感分析

分析社交媒體上用戶評論的情感傾向

識別28種不同情感狀態

客戶反饋分析

產品評價情感分類

對客戶的產品評價進行情感分類

幫助瞭解客戶對產品的具體情感反應

🚀 多語言（英語和中文）GoEmotions分類模型

本倉庫託管了一個經過微調的BERT模型，用於在GoEmotions數據集上進行跨語言情感分類。該模型的獨特之處在於它是在包含英語和中文文本的多語言數據集上進行訓練的，能夠將文本分類到28種不同的情感類別中。

根據GoEmotions分類法，這28種情感類別分別是：“欽佩”“娛樂”“憤怒”“惱火”“認可”“關心”“困惑”“好奇”“渴望”“失望”“不認可”“厭惡”“尷尬”“興奮”“恐懼”“感激”“悲傷”“喜悅”“愛”“緊張”“樂觀”“驕傲”“領悟”“寬慰”“懊悔”“悲傷”“驚訝”和“中立”。

🚀 快速開始

本倉庫中的多語言GoEmotions分類模型可用於對英語和中文文本進行情感分類。以下是使用該模型的代碼示例：

from transformers import AutoTokenizer, AutoModelForSequenceClassification
from transformers import pipeline

# 加載模型和分詞器
tokenizer = AutoTokenizer.from_pretrained("SchuylerH/bert-multilingual-go-emtions")
model = AutoModelForSequenceClassification.from_pretrained("SchuylerH/bert-multilingual-go-emtions")

text = "I love you."
nlp = pipeline("sentiment-analysis", model = model, tokenizer = tokenizer)

result = nlp(text)

print(result)

✨ 主要特性

多語言支持：能夠處理英語和中文文本，實現跨語言情感分類。
豐富的情感類別：可將文本分類到28種不同的情感類別中。
高性能表現：在驗證集上展現出較高的準確率和精確率。

📦 安裝指南

文檔未提及具體安裝步驟，暫無法提供。

💻 使用示例

基礎用法

from transformers import AutoTokenizer, AutoModelForSequenceClassification
from transformers import pipeline

# 加載模型和分詞器
tokenizer = AutoTokenizer.from_pretrained("SchuylerH/bert-multilingual-go-emtions")
model = AutoModelForSequenceClassification.from_pretrained("SchuylerH/bert-multilingual-go-emtions")

text = "I love you."
nlp = pipeline("sentiment-analysis", model = model, tokenizer = tokenizer)

result = nlp(text)

print(result)