🚀 SYAS1
SYAS1-PTBR 是一个基于 Distilbert 的 Transformer 模型,专注于巴西葡萄牙语的情感分析。该模型除了用于研究外,主要目的是为巴西社区做出贡献,因为目前针对葡萄牙语的大语言模型(LLMs)非常匮乏。
🚀 快速开始
SYAS1-PTBR 是基于 Distilbert-base 的模型,通过微调使用 Kaggle 上的 “Portuguese Tweets for Sentiment Analysis” 数据集进行训练。其训练完全在 Google Colab Pro 上使用 NVIDIA L4 GPU 完成。
import torch
import torch.nn.functional as F
from transformers import AutoTokenizer, AutoModelForSequenceClassification
tokenizer = AutoTokenizer.from_pretrained("1Arhat/SYAS1-PTBR")
model = AutoModelForSequenceClassification.from_pretrained("1Arhat/SYAS1-PTBR")
texto = "Esse produto é incrível! Recomendo muito."
inputs = tokenizer(texto, return_tensors="pt")
with torch.no_grad():
outputs = model(**inputs)
logits = outputs.logits
predicao = torch.argmax(logits, dim=1).item()
probs = F.softmax(logits, dim=1)
labels = ["Negativo", "Neutro", "Positivo"]
for idx, label in enumerate(labels):
print(f'{label}: {probs[0][idx]}')
✨ 主要特性
SYAS1 专为葡萄牙语情感分析而创建。由于该模型是基于 DistilBERT 微调训练的,它也可以处理英语,但强烈建议仅用于葡萄牙语。如果需要对其他语言进行情感分析,建议使用其他可用的模型。
📦 安装指南
文档未提及安装步骤,故跳过此章节。
💻 使用示例
基础用法
import torch
import torch.nn.functional as F
from transformers import AutoTokenizer, AutoModelForSequenceClassification
tokenizer = AutoTokenizer.from_pretrained("1Arhat/SYAS1-PTBR")
model = AutoModelForSequenceClassification.from_pretrained("1Arhat/SYAS1-PTBR")
texto = "Esse produto é incrível! Recomendo muito."
inputs = tokenizer(texto, return_tensors="pt")
with torch.no_grad():
outputs = model(**inputs)
logits = outputs.logits
predicao = torch.argmax(logits, dim=1).item()
高级用法
probs = F.softmax(logits, dim=1)
labels = ["Negativo", "Neutro", "Positivo"]
for idx, label in enumerate(labels):
print(f'{label}: {probs[0][idx]}')
📚 详细文档
模型详情
属性 |
详情 |
创建者 |
Arhat |
模型类型 |
文本分类 |
许可证 |
Apache 2.0 |
基础模型 |
distilbert-base-uncased |
语言 |
巴西葡萄牙语 |
结果
指标 |
值 |
准确率 |
0.7384 |
F1 分数 |
0.74 |
🔧 技术细节
SYAS1-PTBR 是基于 Distilbert-base 的模型,通过微调使用 Kaggle 上的 “Portuguese Tweets for Sentiment Analysis” 数据集进行训练。其训练完全在 Google Colab Pro 上使用 NVIDIA L4 GPU 完成。
📄 许可证
该模型使用的许可证为 Apache 2.0。