🚀 ベトナム語感情分析 - Phân tích cảm xúc trong tiếng Việt
このプロジェクトは、ベトナム語の感情分析を行うツールを提供しています。テキストの感情傾向(ポジティブ、ネガティブ、ニュートラル)を正確に判断し、ベトナム語関連のテキスト処理に有効なサポートを提供します。
🚀 クイックスタート
コード例
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
import os
def clear():
os.system('clear')
checkpoint = "mr4/phobert-base-vi-sentiment-analysis"
tokenizer = AutoTokenizer.from_pretrained(checkpoint)
model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
clear()
print("Ngày hôm nay của bạn thế nào?")
val = input("")
raw_inputs = [val]
inputs = tokenizer(raw_inputs, padding=True,
truncation=True, return_tensors="pt")
outputs = model(**inputs)
predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)
clear()
print(">>>>>>>>>>>>>>>>>>>>>>>>>>")
for i, prediction in enumerate(predictions):
print(raw_inputs[i])
for j, value in enumerate(prediction):
print(
" " + model.config.id2label[j] + ": " + str(value.item()))
print("<<<<<<<<<<<<<<<<<<<<<<<<<<")
✨ 主な機能
- 明確な感情分類:モデルはテキストの感情を「ポジティブ」「ネガティブ」「ニュートラル」の3つのカテゴリに正確に分類できます。
- 豊富なサンプル:ドキュメントには、さまざまな感情傾向のテキストサンプルが用意されており、モデルの動作方法を理解しやすくなっています。
📦 インストール
ドキュメントに具体的なインストール手順は記載されていません。必要な場合は、transformers
ライブラリの公式インストールガイドを参照してください。
💻 使用例
基本的な使用法
以下は、このモデルを使用して感情分析を行う基本的なコード例です。
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
import os
def clear():
os.system('clear')
checkpoint = "mr4/phobert-base-vi-sentiment-analysis"
tokenizer = AutoTokenizer.from_pretrained(checkpoint)
model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
clear()
print("Ngày hôm nay của bạn thế nào?")
val = input("")
raw_inputs = [val]
inputs = tokenizer(raw_inputs, padding=True,
truncation=True, return_tensors="pt")
outputs = model(**inputs)
predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)
clear()
print(">>>>>>>>>>>>>>>>>>>>>>>>>>")
for i, prediction in enumerate(predictions):
print(raw_inputs[i])
for j, value in enumerate(prediction):
print(
" " + model.config.id2label[j] + ": " + str(value.item()))
print("<<<<<<<<<<<<<<<<<<<<<<<<<<")
📚 ドキュメント
モデルの説明
このモデルは、テキストの感情を判断するために使用され、「ポジティブ」「ネガティブ」「ニュートラル」のラベルを使用します。
ネガティブなテキストの例
Thời tiết hôm nay không được đẹp, trời mưa và lạnh.
ネガティブ: 0.9596341252326965
ポジティブ: 0.010115462355315685
ニュートラル: 0.030250443145632744
ポジティブなテキストの例
Hôm nay đi làm thật vui, ăn uống thật ngon.
ネガティブ: 0.002220266032963991
ポジティブ: 0.9917450547218323
ニュートラル: 0.006034655496478081
ニュートラルなテキストの例
Bình thường. Không có gì đặc biệt.
ネガティブ: 0.03198615834116936
ポジティブ: 0.05307402461767197
ニュートラル: 0.9149397611618042
ベースモデル
このモデルは、VinAIのPhoBert - Baseモデルをベースに学習されています (https://huggingface.co/vinai/phobert - large)。
学習データ
このモデルは、linhlpvが収集したデータ (https://www.kaggle.com/datasets/linhlpv/vietnamese - sentiment - analyst) をベースに学習されており、データは修正されており、31436件の製品レビュー内容が含まれています。
モデルのバリエーション
未確定です。
想定用途と制限
未確定です。
📄 ライセンス
これはオープンソースのライブラリであり、あらゆる目的に使用できます。このモデルを使用する場合は、出典を明記していただけると幸いですが、必須ではありません。
📞 連絡先
関連情報が必要な場合は、以下のメールアドレスで連絡してください:zZz4everzZz@live.co.uk。