indobert-analisis-sentimen-review-produk開源模型 - 免費部署做印尼語產品評論情感分類

首頁

Indobert Analisis Sentimen Review Produk

由siRendy開發

基於IndoBERT微調的印尼語產品評論情感分類模型，支持正面和負面兩種情感分類。

文本分類

Transformers

其他開源協議:MIT #印尼語情感分析 #電商評論分類 #高準確率BERT

下載量 58

發布時間 : 4/7/2025

模型概述

該模型專用於印尼語產品評論的情感分類任務，能夠將用戶評論劃分為正面(POSITIF)和負面(NEGATIF)兩類情感。

模型特點

高準確率

在驗證集上達到94.43%的準確率和94.42%的F1值。

電商場景優化

專門針對Tokopedia電商平臺的產品評論數據進行訓練和優化。

輕量級微調

基於預訓練的IndoBERT模型進行輕量級微調，訓練週期僅3個epoch。

模型能力

印尼語文本分類

情感分析

產品評論分析

使用案例

電商分析

產品評論情感分析

自動分析電商平臺上用戶對產品的評論情感傾向。

準確識別94%以上的評論情感

客戶反饋監控

即時監控客戶反饋中的負面評論，及時發現問題產品。

🚀 IndoBERT情感分類ID - 二分類

本模型是基於indobenchmark/indobert-base-p2進行微調得到的，用於對印尼語產品評論進行二分類情感分析（積極和消極）。所使用的數據集包含了來自電商平臺Tokopedia的10600條產品評論。

🚀 快速開始

本模型旨在將評論或評價分為兩種情感類別：積極和消極。

✨ 主要特性

評估指標：本模型使用準確率（Accuracy）和F1分數（F1 Score）進行評估。
基礎模型：基於indobenchmark/indobert-base-p2。

📦 安裝指南

文檔未提及安裝步驟，暫不展示。

💻 使用示例

基礎用法

# Load model dan tokenizer
from transformers import AutoTokenizer, AutoModelForSequenceClassification, pipeline
import torch

# Load dari Hugging Face Hub
model = AutoModelForSequenceClassification.from_pretrained("siRendy/indobert-analisis-sentimen-review-produk")
tokenizer = AutoTokenizer.from_pretrained("siRendy/indobert-analisis-sentimen-review-produk")

# Fungsi prediksi
def predict_sentiment(text):
    classifier = pipeline(
        "text-classification",
        model=model,
        tokenizer=tokenizer,
        device=0 if torch.cuda.is_available() else -1
    )

    result = classifier(text)[0]
    return {
        "sentiment": str(result["label"]),
        "confidence": round(result["score"], 4)
    }

# Contoh penggunaan
text = "Produk ini sangat buruk dan tidak layak dibeli."
prediction = predict_sentiment(text)
print(prediction)

📚 詳細文檔

訓練參數配置

以下是訓練時使用的訓練參數配置（TrainingArguments）：

from transformers import TrainingArguments

training_args = TrainingArguments(
    output_dir="./results",
    num_train_epochs=3,
    per_device_train_batch_size=4,
    gradient_accumulation_steps=4,
    per_device_eval_batch_size=4,
    weight_decay=0.05,
    eval_strategy="epoch",
    save_strategy="epoch",
    seed=42,
    load_best_model_at_end=True,
    metric_for_best_model="f1",
    logging_dir="./logs",
    report_to="tensorboard",
    logging_steps=100,
    warmup_ratio=0.05,
)