🚀 基於FERNET - CC_sk的命名實體識別
該模型是在斯洛伐克wikiann數據集上對fav - kky/FERNET - CC_sk進行微調後的版本。它在評估集上取得了以下成績:
- 損失值:0.1763
- 精確率:0.9360
- 召回率:0.9472
- F1值:0.9416
- 準確率:0.9789
✨ 主要特性
- 支持的實體類別:LOCATION(地點)、PERSON(人物)、ORGANIZATION(組織)
💻 使用示例
基礎用法
from transformers import pipeline
ner_pipeline = pipeline(task='ner', model='crabz/slovakbert-ner')
input_sentence = "Minister financií a líder mandátovo najsilnejšieho hnutia OĽaNO Igor Matovič upozorňuje, že následky tretej vlny budú na Slovensku veľmi veľké."
classifications = ner_pipeline(input_sentence)
📚 詳細文檔
訓練過程
訓練超參數
訓練過程中使用了以下超參數:
- 學習率:5e - 05
- 訓練批次大小:24
- 評估批次大小:24
- 隨機種子:42
- 優化器:Adam(β1 = 0.9,β2 = 0.999,ε = 1e - 08)
- 學習率調度器類型:線性
- 訓練輪數:10.0
訓練結果
訓練損失 |
輪數 |
步數 |
驗證損失 |
精確率 |
召回率 |
F1值 |
準確率 |
0.1259 |
1.0 |
834 |
0.1095 |
0.8963 |
0.9182 |
0.9071 |
0.9697 |
0.071 |
2.0 |
1668 |
0.0974 |
0.9270 |
0.9357 |
0.9313 |
0.9762 |
0.0323 |
3.0 |
2502 |
0.1259 |
0.9257 |
0.9330 |
0.9293 |
0.9745 |
0.0175 |
4.0 |
3336 |
0.1347 |
0.9241 |
0.9360 |
0.9300 |
0.9756 |
0.0156 |
5.0 |
4170 |
0.1407 |
0.9337 |
0.9404 |
0.9370 |
0.9780 |
0.0062 |
6.0 |
5004 |
0.1522 |
0.9267 |
0.9410 |
0.9338 |
0.9774 |
0.0055 |
7.0 |
5838 |
0.1559 |
0.9322 |
0.9429 |
0.9375 |
0.9780 |
0.0024 |
8.0 |
6672 |
0.1733 |
0.9321 |
0.9438 |
0.9379 |
0.9779 |
0.0009 |
9.0 |
7506 |
0.1765 |
0.9347 |
0.9468 |
0.9407 |
0.9784 |
0.0002 |
10.0 |
8340 |
0.1763 |
0.9360 |
0.9472 |
0.9416 |
0.9789 |
框架版本
- Transformers 4.14.0.dev0
- Pytorch 1.10.0
- Datasets 1.16.1
- Tokenizers 0.10.3
📄 許可證
本模型採用CC - BY - NC - SA 4.0許可證。
📋 模型信息表格
屬性 |
詳情 |
模型名稱 |
基於FERNET - CC_sk的命名實體識別 |
微調基礎模型 |
fav - kky/FERNET - CC_sk |
訓練數據集 |
斯洛伐克wikiann數據集 |
支持的實體類別 |
LOCATION(地點)、PERSON(人物)、ORGANIZATION(組織) |
評估指標 |
精確率、召回率、F1值、準確率 |
評估集精確率 |
0.9360 |
評估集召回率 |
0.9472 |
評估集F1值 |
0.9416 |
評估集準確率 |
0.9789 |
訓練超參數 |
學習率5e - 05、訓練批次大小24、評估批次大小24、隨機種子42、優化器Adam(β1 = 0.9,β2 = 0.999,ε = 1e - 08)、學習率調度器類型線性、訓練輪數10.0 |
框架版本 |
Transformers 4.14.0.dev0、Pytorch 1.10.0、Datasets 1.16.1、Tokenizers 0.10.3 |
許可證 |
CC - BY - NC - SA 4.0 |