🚀 越南语情感分析 - Phân tích cảm xúc trong tiếng Việt
本项目提供了一个用于越南语情感分析的工具,能够准确判断文本的情感倾向,包括积极、消极和中性,为越南语相关的文本处理提供了有效的支持。
🚀 快速开始
代码示例
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
import os
def clear():
os.system('clear')
checkpoint = "mr4/phobert-base-vi-sentiment-analysis"
tokenizer = AutoTokenizer.from_pretrained(checkpoint)
model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
clear()
print("Ngày hôm nay của bạn thế nào?")
val = input("")
raw_inputs = [val]
inputs = tokenizer(raw_inputs, padding=True,
truncation=True, return_tensors="pt")
outputs = model(**inputs)
predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)
clear()
print(">>>>>>>>>>>>>>>>>>>>>>>>>>")
for i, prediction in enumerate(predictions):
print(raw_inputs[i])
for j, value in enumerate(prediction):
print(
" " + model.config.id2label[j] + ": " + str(value.item()))
print("<<<<<<<<<<<<<<<<<<<<<<<<<<")
✨ 主要特性
- 情感分类明确:模型能够准确地将文本的情感分为“积极”“消极”“中性”三类。
- 示例丰富:文档中提供了多个不同情感倾向的文本示例,便于理解模型的工作方式。
📦 安装指南
文档未提及具体安装步骤,若有需要可参考transformers
库的官方安装说明。
💻 使用示例
基础用法
以下是使用该模型进行情感分析的基本代码示例:
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
import os
def clear():
os.system('clear')
checkpoint = "mr4/phobert-base-vi-sentiment-analysis"
tokenizer = AutoTokenizer.from_pretrained(checkpoint)
model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
clear()
print("Ngày hôm nay của bạn thế nào?")
val = input("")
raw_inputs = [val]
inputs = tokenizer(raw_inputs, padding=True,
truncation=True, return_tensors="pt")
outputs = model(**inputs)
predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)
clear()
print(">>>>>>>>>>>>>>>>>>>>>>>>>>")
for i, prediction in enumerate(predictions):
print(raw_inputs[i])
for j, value in enumerate(prediction):
print(
" " + model.config.id2label[j] + ": " + str(value.item()))
print("<<<<<<<<<<<<<<<<<<<<<<<<<<")
高级用法
文档未提及高级用法相关内容。
📚 详细文档
模型描述
模型用于确定文本的情感,使用的标签为:“积极”“消极”“中性”。
示例如下:
- 消极文本示例:
Thời tiết hôm nay không được đẹp, trời mưa và lạnh.
消极: 0.9596341252326965
积极: 0.010115462355315685
中性: 0.030250443145632744
- 积极文本示例:
Hôm nay đi làm thật vui, ăn uống thật ngon.
消极: 0.002220266032963991
积极: 0.9917450547218323
中性: 0.006034655496478081
- 中性文本示例:
Bình thường. Không có gì đặc biệt.
消极: 0.03198615834116936
积极: 0.05307402461767197
中性: 0.9149397611618042
基础模型
模型基于VinAI的PhoBert - Base模型进行训练 (https://huggingface.co/vinai/phobert - large)。
训练数据
模型基于linhlpv收集的数据进行训练 (https://www.kaggle.com/datasets/linhlpv/vietnamese - sentiment - analyst),数据有修改,包含31436条产品评价内容。
模型变体
暂未确定。
预期用途与限制
暂未确定。
📄 许可证
这是一个开源库,您可以将其用于任何目的。如果您使用此模型,非常感谢您注明来源(不注明也可以)。
📞 联系信息
如有相关信息需求,可通过电子邮件联系:zZz4everzZz@live.co.uk。