🚀 distilroberta-base-ner-wikiann
該模型是 distilroberta-base 在wikiann數據集上的微調版本,可用於標記分類任務,具有較高的準確率和F1分數。
🚀 快速開始
本模型是在wikiann數據集上對 distilroberta-base 進行微調得到的。
評估集F1分數:83.78
測試集F1分數:83.76
💻 使用示例
基礎用法
from transformers import AutoTokenizer, AutoModelForTokenClassification
from transformers import pipeline
tokenizer = AutoTokenizer.from_pretrained("philschmid/distilroberta-base-ner-wikiann")
model = AutoModelForTokenClassification.from_pretrained("philschmid/distilroberta-base-ner-wikiann")
nlp = pipeline("ner", model=model, tokenizer=tokenizer, grouped_entities=True)
example = "My name is Philipp and live in Germany"
nlp(example)
🔧 技術細節
訓練超參數
訓練過程中使用了以下超參數:
- 學習率:4.9086903597787154e-05
- 訓練批次大小:32
- 評估批次大小:16
- 隨機種子:42
- 優化器:Adam(β1=0.9,β2=0.999,ε=1e-08)
- 學習率調度器類型:線性
- 訓練輪數:5.0
- 混合精度訓練:Native AMP
訓練結果
該模型在評估集上取得了以下結果:
- 損失:0.3156
- 精確率:0.8332
- 召回率:0.8424
- F1分數:0.8378
- 準確率:0.9193
在測試集上取得了以下結果:
- 損失:0.3023
- 精確率:0.8301
- 召回率:0.8452
- F1分數:0.8376
- 準確率:0.92
框架版本
- Transformers 4.6.1
- Pytorch 1.8.1+cu101
- Datasets 1.6.2
- Tokenizers 0.10.2
📄 許可證
本項目採用Apache-2.0許可證。
📋 模型信息
屬性 |
詳情 |
模型類型 |
標記分類 |
訓練數據 |
wikiann |
評估指標 |
精確率、召回率、F1分數、準確率 |
模型索引:
- 名稱:distilroberta-base-ner-wikiann
- 結果:
- 任務:
- 數據集:
- 指標:
- 類型:精確率
- 值:0.8331921416757433
- 名稱:精確率
- 類型:召回率
- 值:0.84243586083126
- 名稱:召回率
- 類型:F1分數
- 值:0.8377885044416501
- 名稱:F1分數
- 類型:準確率
- 值:0.91930707459758
- 名稱:準確率
- 任務:
- 數據集:
- 名稱:wikiann
- 類型:wikiann
- 配置:en
- 分割:測試集
- 指標:
- 類型:準確率
- 值:0.9200373733433721
- 名稱:準確率
- 已驗證:是
- 驗證令牌:eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiNGFmMTNkZDYwMDllNjE5ZTVjYzYwYTQyMDFjYzNkYTkxZmVmOTNkOTFlOTU4MmM2MmFlMWQzMTcwZGViOTA3ZCIsInZlcnNpb24iOjF9.pOwPcBmA7XJdq9QgCNoCivTsu0WfsCnvRtzObDrqhFtrO2PjLNf9tmlQeahGcBGFo6yIHvhndBYwf__lN-4nBg
- 類型:精確率
- 值:0.9258482820953792
- 名稱:精確率
- 已驗證:是
- 驗證令牌:eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiMzFhNGJlMzk0N2JmYmU3YjAxZjJjNGFjZjZjOTJhODc3MjQyODMzYzE2Y2Y4NWQ4YThhMjg3NWI1MGRmODczMiIsInZlcnNpb24iOjF9.eVTQJqXeGY0XZaGURXBrT8sjMl7O_SxuFB4NS7C6jbpr46MMZdusvzkmndOIrGjReB2vB3sAmpcT0hydpqRkDg
- 類型:召回率
- 值:0.9347545055892119
- 名稱:召回率
- 已驗證:是
- 驗證令牌:eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiN2Y5ZGIzM2JlOWNjZGUzOWU5MGIwOTFiODM4NmU3NGQ3ZmUxYzM4ZmYxNjIwOTE0ZWFiYWJhMzk4NDg4ZjI3MSIsInZlcnNpb24iOjF9.tzl3gTEDFuj7kpGsERkQzXfh7B0Qwao31VcXKF1rSvf3ulVgXsU-vTB2oZiGr3w5AySr_80J0pIpSpvGzfhNAQ
- 類型:F1分數
- 值:0.9302800779500893
- 名稱:F1分數
- 已驗證:是
- 驗證令牌:eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiYjY5MDM2ZWQ1MzJmNDFhMGFmZmQ1MzM0NmJmOTVmYTM1OWZmNzc4YWI4ZWUwMTFlMTQ5MTJmYWRhNmVmZTUyZCIsInZlcnNpb24iOjF9.zMUq4ZGLfu0eQF7lHNkaf6LByypIevygVGLpBA3jW80OUy5VeZDK7d6q0RV_N4SO5gTkLEjoDvSqLDcaw-9VBw
- 類型:損失
- 值:0.3007512390613556
- 名稱:損失
- 已驗證:是
- 驗證令牌:eyJhbGciOiJFZERTQSIsInR5cCI6IkpXVCJ9.eyJoYXNoIjoiNzI5YmIxODFkN2NkYzJkZDgyZTc4MDhlMDkyMzM3NWFiZWQ1MmUzMDA1MGYyM2RlNzVlNTIwNDcwNTFmNjYwMSIsInZlcnNpb24iOjF9.D8vx5YhoNHY4CdRXEt3rL95odR2kZJ1e_c34HD28xX9YeWKIjjt4E0FSz6Xw4ufJd9UlCnQ_u4VPFTYI-RXlCQ