SaBERT西班牙文情感分析开源模型 - 免费检测文本积极或消极情感

首页

Sabert Spanish Sentiment Analysis

由 VerificadoProfesional 开发

基于BERT的西班牙文情感分析分类器，用于检测文本中的积极和消极情感。

文本分类

Transformers

西班牙语开源协议:Apache-2.0 #西班牙文情感分析 #BERT微调模型 #推文情感检测

下载量 2,553

发布时间 : 4/24/2024

模型简介

该模型是一个基于BERT的文本分类器，专门用于西班牙文文本的情感分析，能够有效识别积极和消极情感。

模型特点

基于BERT架构

使用BERT架构进行微调，适用于西班牙文文本的情感分析。

高准确率

在测试集上达到86.47%的准确率，表现优异。

多地区数据训练

训练数据包含来自不同地区的11,500条西班牙文推文，覆盖广泛。

模型能力

西班牙文文本情感分析

积极/消极情感分类

使用案例

社交媒体分析

推文情感分析

分析西班牙文推文的情感倾向，用于舆情监控。

准确识别积极和消极情感。

客户反馈分析

产品评论情感分析

分析西班牙文产品评论的情感倾向，帮助改进产品。

有效分类积极和消极评论。

🚀 西班牙文情感分析分类器

本项目是一个基于BERT的文本分类器，用于检测西班牙文文本中的情感倾向。它在特定数据集上进行了微调，能够有效识别积极和消极情感。

🚀 快速开始

安装

你可以使用pip安装所需的依赖项：

pip install transformers torch

加载模型

from transformers import BertForSequenceClassification, BertTokenizer
model = BertForSequenceClassification.from_pretrained("VerificadoProfesional/SaBERT-Spanish-Sentiment-Analysis")
tokenizer = BertTokenizer.from_pretrained("VerificadoProfesional/SaBERT-Spanish-Sentiment-Analysis")

预测函数

def predict(model,tokenizer,text,threshold = 0.5):   
        inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True, max_length=128)
        with torch.no_grad():
            outputs = model(**inputs)
        
        logits = outputs.logits
        probabilities = torch.softmax(logits, dim=1).squeeze().tolist()
        
        predicted_class = torch.argmax(logits, dim=1).item()
        if probabilities[predicted_class] <= threshold and predicted_class == 1:
            predicted_class = 0
  
        return bool(predicted_class), probabilities

进行预测

text = "Your Spanish news text here"
predicted_label,probabilities = predict(model,tokenizer,text)
print(f"Text: {text}")
print(f"Predicted Class: {predicted_label}")
print(f"Probabilities: {probabilities}")

✨ 主要特性

该基于BERT的文本分类器是布宜诺斯艾利斯大学（UBA）计算机工程学位论文项目。
模型旨在检测西班牙文中的情感，并在 dccuchile/bert-base-spanish-wwm-uncased 模型上使用特定超参数进行了微调。
在包含来自不同地区的11,500条西班牙文推文的数据集上进行训练，这些推文有积极和消极两种情感，来源于精心策划的TASS数据集组合。

📦 安装指南

你可以使用以下命令安装所需依赖：

pip install transformers torch

💻 使用示例

基础用法

from transformers import BertForSequenceClassification, BertTokenizer
model = BertForSequenceClassification.from_pretrained("VerificadoProfesional/SaBERT-Spanish-Sentiment-Analysis")
tokenizer = BertTokenizer.from_pretrained("VerificadoProfesional/SaBERT-Spanish-Sentiment-Analysis")

def predict(model,tokenizer,text,threshold = 0.5):   
        inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True, max_length=128)
        with torch.no_grad():
            outputs = model(**inputs)
        
        logits = outputs.logits
        probabilities = torch.softmax(logits, dim=1).squeeze().tolist()
        
        predicted_class = torch.argmax(logits, dim=1).item()
        if probabilities[predicted_class] <= threshold and predicted_class == 1:
            predicted_class = 0
  
        return bool(predicted_class), probabilities

text = "Your Spanish news text here"
predicted_label,probabilities = predict(model,tokenizer,text)
print(f"Text: {text}")
print(f"Predicted Class: {predicted_label}")
print(f"Probabilities: {probabilities}")

📚 详细文档

团队成员

模型详情

属性	详情
基础模型	dccuchile/bert-base-spanish-wwm-uncased
超参数	dropout_rate = 0.1 num_classes = 2 max_length = 128 batch_size = 16 num_epochs = 5 learning_rate = 3e-5
训练数据	11,500条西班牙文推文（积极和消极）