🚀 土耳其語情感分析模型
本項目基於預訓練模型開發了一個用於土耳其語情感分析的模型,能夠將土耳其語文本分類為消極、中性和積極三種情感類別,在相關任務中表現出色。
🚀 快速開始
本模型是 dbmdz/bert-base-turkish-cased 在 winvoker/turkish-sentiment-analysis-dataset 數據集上進行微調後的版本。它在評估集上取得了以下結果:
- 損失值:0.0880
- 準確率:0.9688
- F1 宏值:0.9454
- F1 加權值:0.9685
- 精確率:0.9683
- 召回率:0.9688
✨ 主要特性
- 基於 BERT 架構(dbmdz 土耳其語 BERT),在大規模土耳其語情感分析數據集上進行微調。
- 能夠將土耳其語文本分類為消極、中性和積極三種情感類別。
📦 安裝指南
文檔未提及安裝步驟,跳過此章節。
💻 使用示例
基礎用法
from transformers import pipeline
pipe = pipeline("text-classification", model="kaixkhazaki/turkish-sentiment")
pipe("Kargo geç geldi ve ürün beklentimi pek karşılamadı.")
>> [{'label': 'Negative', 'score': 0.984860897064209}]
pipe("Yemek lezzetliydi ancak servis yavaş ve çalışanlar ilgisizdi, pek anlayamadım nasıl hissettiğimi.")
>> [{'label': 'Notr', 'score': 0.9881975054740906}]
pipe("Gerçekten müthiş bir deneyimdi, keşke hep burda kalabilsem.")
>> [{'label': 'Positive', 'score': 0.9942901134490967}]
📚 詳細文檔
模型描述
基於 BERT(dbmdz 土耳其語 BERT)的模型,在大規模土耳其語情感分析數據集上進行了微調。該模型將土耳其語文本分類為三種情感類別:消極、中性和積極。
屬性 |
詳情 |
模型類型 |
BertForSequenceClassification |
基礎模型 |
dbmdz/bert-base-turkish-cased |
語言 |
土耳其語 |
預期用途與限制
- 適用於涉及情感分析的土耳其語文本分類任務。
- 適用於社交媒體數據、產品評論或土耳其語通用情感檢測。
訓練和評估數據
在包含 440,679 個訓練樣本和 48,965 個驗證樣本的組合數據集上進行微調。
訓練過程
在單個 GPU 上使用整個數據集進行了約 25 分鐘(1600 步)的訓練。
訓練超參數
訓練期間使用了以下超參數:
- 學習率:3e-05
- 訓練批次大小:64
- 評估批次大小:128
- 隨機種子:42
- 優化器:使用 adamw_torch,β=(0.9, 0.999),ε=1e-08,無額外優化器參數
- 學習率調度器類型:餘弦
- 學習率調度器預熱步數:400
- 訓練步數:1600
訓練結果
訓練損失 |
輪數 |
步數 |
驗證損失 |
準確率 |
F1 宏值 |
F1 加權值 |
精確率 |
召回率 |
0.3538 |
0.0581 |
400 |
0.1162 |
0.9582 |
0.9243 |
0.9568 |
0.9572 |
0.9582 |
0.1131 |
0.1162 |
800 |
0.1034 |
0.9639 |
0.9369 |
0.9635 |
0.9633 |
0.9639 |
0.1026 |
0.1743 |
1200 |
0.0940 |
0.9649 |
0.9411 |
0.9652 |
0.9657 |
0.9649 |
0.0936 |
0.2324 |
1600 |
0.0880 |
0.9688 |
0.9454 |
0.9685 |
0.9683 |
0.9688 |
框架版本
- Transformers 4.48.0.dev0
- Pytorch 2.4.1+cu121
- Datasets 3.1.0
- Tokenizers 0.21.0
引用信息
@misc{turkish-sentiment,
title={Turkish Sentiment Analysis using Turkish BERT},
author={Fatih Demrici},
year={2025},
howpublished={\url{https://huggingface.co/kaixkhazaki/turkish-sentiment}},
}
📄 許可證
本項目採用 MIT 許可證。