roberta-base_stress_classification开源模型 - 精准识别员工评论中的压力相关内容

首页

Roberta Base Stress Classification

由 dstefa 开发

基于roberta-base微调的压力分类模型，用于识别员工评论中的压力相关内容。

文本分类

Transformers

开源协议:MIT #员工情绪分析 #高精度分类 #职场压力检测

下载量 20

发布时间 : 1/23/2024

模型简介

该模型在10万条Glassdoor员工评论上微调，专门用于分类文本是否包含工作压力相关内容。

模型特点

高准确率

在评估集上达到96.47%的准确率和F1值

专业领域优化

专门针对员工评论数据进行微调，适合职场压力识别

高效训练

仅需5轮训练即可达到优异性能

模型能力

文本分类

压力内容识别

员工评论分析

使用案例

人力资源管理

员工满意度分析

分析员工评论中的压力内容，评估工作环境

准确识别96%以上的压力相关评论

职场压力监测

自动监测员工反馈中的压力信号

帮助HR部门及时发现潜在问题

🚀 roberta-base_stress_classification

本模型是基于100000名员工在Glassdoor数据集上的评论，对 roberta-base 进行微调后的版本。它能够对文本进行压力分类，判断文本所描述的情境是否会让人产生压力，在实际应用中具有较高的准确性和实用性。

🚀 快速开始

本模型是 roberta-base 在Glassdoor数据集上的微调版本，该数据集基于100000名员工的评论。它在评估集上取得了以下成绩：

损失率：0.1800
准确率：0.9647
F1值：0.9647
精确率：0.9647
召回率：0.9647

✨ 主要特性

多指标评估：使用准确率、F1值、精确率和召回率等多个指标进行评估，全面衡量模型性能。
数据分类明确：训练数据清晰地分为“无压力”和“有压力”两类。
良好的性能表现：在评估集和训练过程中都展现出了较高的准确率和F1值。

📦 安装指南

文档未提及安装步骤，暂不提供。

💻 使用示例

基础用法

from transformers import AutoTokenizer, AutoModelForSequenceClassification
from transformers import pipeline

tokenizer = AutoTokenizer.from_pretrained("dstefa/roberta-base_topic_classification_nyt_news")
model = AutoModelForSequenceClassification.from_pretrained("dstefa/roberta-base_topic_classification_nyt_news")
pipe = pipeline("text-classification", model=model, tokenizer=tokenizer, device=0)

text = "They also caused so much stress because some leaders valued optics over output."
pipe(text)

[{'label': 'Stressed', 'score': 0.9959163069725037}]

📚 详细文档

训练数据

训练数据分类如下：

类别	描述
0	无压力
1	有压力

训练过程

训练超参数

训练过程中使用了以下超参数：

学习率：5e - 05
训练批次大小：8
评估批次大小：8
随机种子：42
优化器：Adam（β1 = 0.9，β2 = 0.999，ε = 1e - 08）
学习率调度器类型：线性
学习率调度器热身步数：500
训练轮数：5

训练结果

训练损失	轮数	步数	验证损失	准确率	F1值	精确率	召回率
0.704	1.0	8000	0.6933	0.5	0.3333	0.25	0.5
0.6926	2.0	16000	0.6980	0.5	0.3333	0.25	0.5
0.0099	3.0	24000	0.1800	0.9647	0.9647	0.9647	0.9647
0.2727	4.0	32000	0.2243	0.9526	0.9526	0.9527	0.9526
0.0618	5.0	40000	0.2128	0.9536	0.9536	0.9546	0.9536