🚀 土耳其语情感分析模型
本项目基于预训练模型开发了一个用于土耳其语情感分析的模型,能够将土耳其语文本分类为消极、中性和积极三种情感类别,在相关任务中表现出色。
🚀 快速开始
本模型是 dbmdz/bert-base-turkish-cased 在 winvoker/turkish-sentiment-analysis-dataset 数据集上进行微调后的版本。它在评估集上取得了以下结果:
- 损失值:0.0880
- 准确率:0.9688
- F1 宏值:0.9454
- F1 加权值:0.9685
- 精确率:0.9683
- 召回率:0.9688
✨ 主要特性
- 基于 BERT 架构(dbmdz 土耳其语 BERT),在大规模土耳其语情感分析数据集上进行微调。
- 能够将土耳其语文本分类为消极、中性和积极三种情感类别。
📦 安装指南
文档未提及安装步骤,跳过此章节。
💻 使用示例
基础用法
from transformers import pipeline
pipe = pipeline("text-classification", model="kaixkhazaki/turkish-sentiment")
pipe("Kargo geç geldi ve ürün beklentimi pek karşılamadı.")
>> [{'label': 'Negative', 'score': 0.984860897064209}]
pipe("Yemek lezzetliydi ancak servis yavaş ve çalışanlar ilgisizdi, pek anlayamadım nasıl hissettiğimi.")
>> [{'label': 'Notr', 'score': 0.9881975054740906}]
pipe("Gerçekten müthiş bir deneyimdi, keşke hep burda kalabilsem.")
>> [{'label': 'Positive', 'score': 0.9942901134490967}]
📚 详细文档
模型描述
基于 BERT(dbmdz 土耳其语 BERT)的模型,在大规模土耳其语情感分析数据集上进行了微调。该模型将土耳其语文本分类为三种情感类别:消极、中性和积极。
属性 |
详情 |
模型类型 |
BertForSequenceClassification |
基础模型 |
dbmdz/bert-base-turkish-cased |
语言 |
土耳其语 |
预期用途与限制
- 适用于涉及情感分析的土耳其语文本分类任务。
- 适用于社交媒体数据、产品评论或土耳其语通用情感检测。
训练和评估数据
在包含 440,679 个训练样本和 48,965 个验证样本的组合数据集上进行微调。
训练过程
在单个 GPU 上使用整个数据集进行了约 25 分钟(1600 步)的训练。
训练超参数
训练期间使用了以下超参数:
- 学习率:3e-05
- 训练批次大小:64
- 评估批次大小:128
- 随机种子:42
- 优化器:使用 adamw_torch,β=(0.9, 0.999),ε=1e-08,无额外优化器参数
- 学习率调度器类型:余弦
- 学习率调度器预热步数:400
- 训练步数:1600
训练结果
训练损失 |
轮数 |
步数 |
验证损失 |
准确率 |
F1 宏值 |
F1 加权值 |
精确率 |
召回率 |
0.3538 |
0.0581 |
400 |
0.1162 |
0.9582 |
0.9243 |
0.9568 |
0.9572 |
0.9582 |
0.1131 |
0.1162 |
800 |
0.1034 |
0.9639 |
0.9369 |
0.9635 |
0.9633 |
0.9639 |
0.1026 |
0.1743 |
1200 |
0.0940 |
0.9649 |
0.9411 |
0.9652 |
0.9657 |
0.9649 |
0.0936 |
0.2324 |
1600 |
0.0880 |
0.9688 |
0.9454 |
0.9685 |
0.9683 |
0.9688 |
框架版本
- Transformers 4.48.0.dev0
- Pytorch 2.4.1+cu121
- Datasets 3.1.0
- Tokenizers 0.21.0
引用信息
@misc{turkish-sentiment,
title={Turkish Sentiment Analysis using Turkish BERT},
author={Fatih Demrici},
year={2025},
howpublished={\url{https://huggingface.co/kaixkhazaki/turkish-sentiment}},
}
📄 许可证
本项目采用 MIT 许可证。