🚀 基于FERNET - CC_sk的命名实体识别
该模型是在斯洛伐克wikiann数据集上对fav - kky/FERNET - CC_sk进行微调后的版本。它在评估集上取得了以下成绩:
- 损失值:0.1763
- 精确率:0.9360
- 召回率:0.9472
- F1值:0.9416
- 准确率:0.9789
✨ 主要特性
- 支持的实体类别:LOCATION(地点)、PERSON(人物)、ORGANIZATION(组织)
💻 使用示例
基础用法
from transformers import pipeline
ner_pipeline = pipeline(task='ner', model='crabz/slovakbert-ner')
input_sentence = "Minister financií a líder mandátovo najsilnejšieho hnutia OĽaNO Igor Matovič upozorňuje, že následky tretej vlny budú na Slovensku veľmi veľké."
classifications = ner_pipeline(input_sentence)
📚 详细文档
训练过程
训练超参数
训练过程中使用了以下超参数:
- 学习率:5e - 05
- 训练批次大小:24
- 评估批次大小:24
- 随机种子:42
- 优化器:Adam(β1 = 0.9,β2 = 0.999,ε = 1e - 08)
- 学习率调度器类型:线性
- 训练轮数:10.0
训练结果
训练损失 |
轮数 |
步数 |
验证损失 |
精确率 |
召回率 |
F1值 |
准确率 |
0.1259 |
1.0 |
834 |
0.1095 |
0.8963 |
0.9182 |
0.9071 |
0.9697 |
0.071 |
2.0 |
1668 |
0.0974 |
0.9270 |
0.9357 |
0.9313 |
0.9762 |
0.0323 |
3.0 |
2502 |
0.1259 |
0.9257 |
0.9330 |
0.9293 |
0.9745 |
0.0175 |
4.0 |
3336 |
0.1347 |
0.9241 |
0.9360 |
0.9300 |
0.9756 |
0.0156 |
5.0 |
4170 |
0.1407 |
0.9337 |
0.9404 |
0.9370 |
0.9780 |
0.0062 |
6.0 |
5004 |
0.1522 |
0.9267 |
0.9410 |
0.9338 |
0.9774 |
0.0055 |
7.0 |
5838 |
0.1559 |
0.9322 |
0.9429 |
0.9375 |
0.9780 |
0.0024 |
8.0 |
6672 |
0.1733 |
0.9321 |
0.9438 |
0.9379 |
0.9779 |
0.0009 |
9.0 |
7506 |
0.1765 |
0.9347 |
0.9468 |
0.9407 |
0.9784 |
0.0002 |
10.0 |
8340 |
0.1763 |
0.9360 |
0.9472 |
0.9416 |
0.9789 |
框架版本
- Transformers 4.14.0.dev0
- Pytorch 1.10.0
- Datasets 1.16.1
- Tokenizers 0.10.3
📄 许可证
本模型采用CC - BY - NC - SA 4.0许可证。
📋 模型信息表格
属性 |
详情 |
模型名称 |
基于FERNET - CC_sk的命名实体识别 |
微调基础模型 |
fav - kky/FERNET - CC_sk |
训练数据集 |
斯洛伐克wikiann数据集 |
支持的实体类别 |
LOCATION(地点)、PERSON(人物)、ORGANIZATION(组织) |
评估指标 |
精确率、召回率、F1值、准确率 |
评估集精确率 |
0.9360 |
评估集召回率 |
0.9472 |
评估集F1值 |
0.9416 |
评估集准确率 |
0.9789 |
训练超参数 |
学习率5e - 05、训练批次大小24、评估批次大小24、随机种子42、优化器Adam(β1 = 0.9,β2 = 0.999,ε = 1e - 08)、学习率调度器类型线性、训练轮数10.0 |
框架版本 |
Transformers 4.14.0.dev0、Pytorch 1.10.0、Datasets 1.16.1、Tokenizers 0.10.3 |
许可证 |
CC - BY - NC - SA 4.0 |