SYAS1-PTBR開源模型 - 免費支持巴西葡萄牙語情感分析

首頁

SYAS1 PTBR

由1Arhat開發

基於Distilbert架構的Transformer模型，專注於巴西葡萄牙語的情感分析

文本分類

Transformers

其他#巴西葡萄牙語情感分析 #DistilBERT微調 #社交媒體文本處理

下載量 118

發布時間 : 3/25/2025

模型概述

SYAS1-PTBR是針對巴西葡萄牙語的情感分析模型，旨在填補葡萄牙語大型語言模型資源的空白，特別服務於巴西社區。

模型特點

葡萄牙語優化

專門針對巴西葡萄牙語進行優化訓練，解決該語言資源匱乏的問題

高效架構

基於DistilBERT架構，在保持性能的同時減少計算資源需求

社區服務導向

特別關注服務巴西社區的實際需求

模型能力

葡萄牙語文本情感分析

情感極性分類(正面/中性/負面)

使用案例

社交媒體分析

推特情感分析

分析葡萄牙語推文的情感傾向

準確率73.84%

產品評價分析

用戶評論分類

對葡萄牙語產品評論進行情感分類

🚀 SYAS1

SYAS1-PTBR 是一個基於 Distilbert 的 Transformer 模型，專注於巴西葡萄牙語的情感分析。該模型除了用於研究外，主要目的是為巴西社區做出貢獻，因為目前針對葡萄牙語的大語言模型（LLMs）非常匱乏。

🚀 快速開始

SYAS1-PTBR 是基於 Distilbert-base 的模型，通過微調使用 Kaggle 上的 “Portuguese Tweets for Sentiment Analysis” 數據集進行訓練。其訓練完全在 Google Colab Pro 上使用 NVIDIA L4 GPU 完成。

import torch
import torch.nn.functional as F
from transformers import AutoTokenizer, AutoModelForSequenceClassification

tokenizer = AutoTokenizer.from_pretrained("1Arhat/SYAS1-PTBR")
model = AutoModelForSequenceClassification.from_pretrained("1Arhat/SYAS1-PTBR")

# 待分類的文本
texto = "Esse produto é incrível! Recomendo muito."

# 處理文本
inputs = tokenizer(texto, return_tensors="pt")

# 模型預測
with torch.no_grad():
    outputs = model(**inputs)

logits = outputs.logits
predicao = torch.argmax(logits, dim=1).item()

#print(f"Classe prevista: {predicao}")
# 輸出: Classe prevista: 2

# 若希望模型輸出所有類別的概率
probs = F.softmax(logits, dim=1)  # 使用 softmax 函數將 logits 輸出轉換為概率

labels = ["Negativo", "Neutro", "Positivo"]

for idx, label in enumerate(labels):
    print(f'{label}: {probs[0][idx]}')

# 輸出:
#Negativo: 0.2401905506849289
#Neutro: 0.028042761608958244
#Positivo: 0.7317667007446289

# 若希望更便捷地使用，可使用 Hugging face 的 pipeline

✨ 主要特性

SYAS1 專為葡萄牙語情感分析而創建。由於該模型是基於 DistilBERT 微調訓練的，它也可以處理英語，但強烈建議僅用於葡萄牙語。如果需要對其他語言進行情感分析，建議使用其他可用的模型。

📦 安裝指南

文檔未提及安裝步驟，故跳過此章節。

💻 使用示例

基礎用法

import torch
import torch.nn.functional as F
from transformers import AutoTokenizer, AutoModelForSequenceClassification

tokenizer = AutoTokenizer.from_pretrained("1Arhat/SYAS1-PTBR")
model = AutoModelForSequenceClassification.from_pretrained("1Arhat/SYAS1-PTBR")

# 待分類的文本
texto = "Esse produto é incrível! Recomendo muito."

# 處理文本
inputs = tokenizer(texto, return_tensors="pt")

# 模型預測
with torch.no_grad():
    outputs = model(**inputs)

logits = outputs.logits
predicao = torch.argmax(logits, dim=1).item()

#print(f"Classe prevista: {predicao}")
# 輸出: Classe prevista: 2

高級用法

# 若希望模型輸出所有類別的概率
probs = F.softmax(logits, dim=1)  # 使用 softmax 函數將 logits 輸出轉換為概率

labels = ["Negativo", "Neutro", "Positivo"]

for idx, label in enumerate(labels):
    print(f'{label}: {probs[0][idx]}')

# 輸出:
#Negativo: 0.2401905506849289
#Neutro: 0.028042761608958244
#Positivo: 0.7317667007446289

# 若希望更便捷地使用，可使用 Hugging face 的 pipeline