🚀 越南語情感分析 - Phân tích cảm xúc trong tiếng Việt
本項目提供了一個用於越南語情感分析的工具,能夠準確判斷文本的情感傾向,包括積極、消極和中性,為越南語相關的文本處理提供了有效的支持。
🚀 快速開始
代碼示例
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
import os
def clear():
os.system('clear')
checkpoint = "mr4/phobert-base-vi-sentiment-analysis"
tokenizer = AutoTokenizer.from_pretrained(checkpoint)
model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
clear()
print("Ngày hôm nay của bạn thế nào?")
val = input("")
raw_inputs = [val]
inputs = tokenizer(raw_inputs, padding=True,
truncation=True, return_tensors="pt")
outputs = model(**inputs)
predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)
clear()
print(">>>>>>>>>>>>>>>>>>>>>>>>>>")
for i, prediction in enumerate(predictions):
print(raw_inputs[i])
for j, value in enumerate(prediction):
print(
" " + model.config.id2label[j] + ": " + str(value.item()))
print("<<<<<<<<<<<<<<<<<<<<<<<<<<")
✨ 主要特性
- 情感分類明確:模型能夠準確地將文本的情感分為“積極”“消極”“中性”三類。
- 示例豐富:文檔中提供了多個不同情感傾向的文本示例,便於理解模型的工作方式。
📦 安裝指南
文檔未提及具體安裝步驟,若有需要可參考transformers
庫的官方安裝說明。
💻 使用示例
基礎用法
以下是使用該模型進行情感分析的基本代碼示例:
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
import os
def clear():
os.system('clear')
checkpoint = "mr4/phobert-base-vi-sentiment-analysis"
tokenizer = AutoTokenizer.from_pretrained(checkpoint)
model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
clear()
print("Ngày hôm nay của bạn thế nào?")
val = input("")
raw_inputs = [val]
inputs = tokenizer(raw_inputs, padding=True,
truncation=True, return_tensors="pt")
outputs = model(**inputs)
predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)
clear()
print(">>>>>>>>>>>>>>>>>>>>>>>>>>")
for i, prediction in enumerate(predictions):
print(raw_inputs[i])
for j, value in enumerate(prediction):
print(
" " + model.config.id2label[j] + ": " + str(value.item()))
print("<<<<<<<<<<<<<<<<<<<<<<<<<<")
高級用法
文檔未提及高級用法相關內容。
📚 詳細文檔
模型描述
模型用於確定文本的情感,使用的標籤為:“積極”“消極”“中性”。
示例如下:
- 消極文本示例:
Thời tiết hôm nay không được đẹp, trời mưa và lạnh.
消極: 0.9596341252326965
積極: 0.010115462355315685
中性: 0.030250443145632744
- 積極文本示例:
Hôm nay đi làm thật vui, ăn uống thật ngon.
消極: 0.002220266032963991
積極: 0.9917450547218323
中性: 0.006034655496478081
- 中性文本示例:
Bình thường. Không có gì đặc biệt.
消極: 0.03198615834116936
積極: 0.05307402461767197
中性: 0.9149397611618042
基礎模型
模型基於VinAI的PhoBert - Base模型進行訓練 (https://huggingface.co/vinai/phobert - large)。
訓練數據
模型基於linhlpv收集的數據進行訓練 (https://www.kaggle.com/datasets/linhlpv/vietnamese - sentiment - analyst),數據有修改,包含31436條產品評價內容。
模型變體
暫未確定。
預期用途與限制
暫未確定。
📄 許可證
這是一個開源庫,您可以將其用於任何目的。如果您使用此模型,非常感謝您註明來源(不註明也可以)。
📞 聯繫信息
如有相關信息需求,可通過電子郵件聯繫:zZz4everzZz@live.co.uk。