bert-multilingual-go-emtions开源模型 - 支持中英文本28种情感类别分类

首页

Bert Multilingual Go Emtions

由 SchuylerH 开发

基于GoEmotions数据集进行跨语言情感分类的微调BERT模型，支持英文和中文文本，能分类28种情感类别。

文本分类

Transformers

支持多种语言开源协议:Apache-2.0 #多语言情感分析 #28类细粒度分类 #中英混合训练

下载量 929

发布时间 : 7/25/2023

模型简介

该模型是一个多语言情感分析模型，能够将输入的英文或中文文本分类为28种不同的情感类别，包括钦佩、娱乐、愤怒、爱等。

模型特点

多语言支持

能够处理英文和中文文本的情感分析任务

细粒度情感分类

将文本分类为28种不同的情感类别，提供更精细的情感分析

高准确率

在验证集上达到85.95%的准确率和90.17%的F1分数

模型能力

英文情感分析

中文情感分析

多标签情感分类

使用案例

社交媒体分析

用户评论情感分析

分析社交媒体上用户评论的情感倾向

识别28种不同情感状态

客户反馈分析

产品评价情感分类

对客户的产品评价进行情感分类

帮助了解客户对产品的具体情感反应

🚀 多语言（英语和中文）GoEmotions分类模型

本仓库托管了一个经过微调的BERT模型，用于在GoEmotions数据集上进行跨语言情感分类。该模型的独特之处在于它是在包含英语和中文文本的多语言数据集上进行训练的，能够将文本分类到28种不同的情感类别中。

根据GoEmotions分类法，这28种情感类别分别是：“钦佩”“娱乐”“愤怒”“恼火”“认可”“关心”“困惑”“好奇”“渴望”“失望”“不认可”“厌恶”“尴尬”“兴奋”“恐惧”“感激”“悲伤”“喜悦”“爱”“紧张”“乐观”“骄傲”“领悟”“宽慰”“懊悔”“悲伤”“惊讶”和“中立”。

🚀 快速开始

本仓库中的多语言GoEmotions分类模型可用于对英语和中文文本进行情感分类。以下是使用该模型的代码示例：

from transformers import AutoTokenizer, AutoModelForSequenceClassification
from transformers import pipeline

# 加载模型和分词器
tokenizer = AutoTokenizer.from_pretrained("SchuylerH/bert-multilingual-go-emtions")
model = AutoModelForSequenceClassification.from_pretrained("SchuylerH/bert-multilingual-go-emtions")

text = "I love you."
nlp = pipeline("sentiment-analysis", model = model, tokenizer = tokenizer)

result = nlp(text)

print(result)

✨ 主要特性

多语言支持：能够处理英语和中文文本，实现跨语言情感分类。
丰富的情感类别：可将文本分类到28种不同的情感类别中。
高性能表现：在验证集上展现出较高的准确率和精确率。

📦 安装指南

文档未提及具体安装步骤，暂无法提供。

💻 使用示例

基础用法

from transformers import AutoTokenizer, AutoModelForSequenceClassification
from transformers import pipeline

# 加载模型和分词器
tokenizer = AutoTokenizer.from_pretrained("SchuylerH/bert-multilingual-go-emtions")
model = AutoModelForSequenceClassification.from_pretrained("SchuylerH/bert-multilingual-go-emtions")

text = "I love you."
nlp = pipeline("sentiment-analysis", model = model, tokenizer = tokenizer)

result = nlp(text)

print(result)