modernbert-ner-conll2003開源命名實體識別模型 - 精準識別人員、組織和地點

首頁

Modernbert Ner Conll2003

由IsmaelMousa開發

基於ModernBERT-base微調的命名實體識別模型，在CoNLL2003數據集上訓練，擅長識別人物、組織和地點實體。

序列標註

Transformers

英語開源協議:Apache-2.0 #高精度NER #英文實體識別 #ModernBERT優化

下載量 40

發布時間 : 1/7/2025

模型概述

該模型是針對英文文本的命名實體識別(NER)模型，能夠準確識別文本中的人物(PER)、組織(ORG)和地點(LOC)等實體。

模型特點

高性能實體識別

在CoNLL2003驗證集上達到F1值0.8455的優異表現

基於ModernBERT架構

採用優化的BERT架構，具有更強的上下文理解能力

多類別實體識別

可同時識別人物、組織和地點三類實體

模型能力

命名實體識別

文本分析

信息提取

使用案例

信息提取

新聞文本分析

從新聞文章中提取關鍵人物、組織和地點信息

準確識別文本中的命名實體

文檔處理

自動化處理商業文檔中的實體信息

提高文檔處理效率

🚀 ModernBERT命名實體識別（CoNLL2003）

本模型是 answerdotai/ModernBERT-base 在CoNLL2003數據集上針對命名實體識別（NER）任務進行微調後的版本。

在識別人物、組織和地點等實體的任務中表現出色。

該模型在評估集上取得了以下成績：

損失率：0.0992
精確率：0.8349
召回率：0.8563
F1值：0.8455
準確率：0.9752

✨ 主要特性

強大的實體識別能力：能夠準確識別文本中的人物、組織和地點等命名實體。
基於優質基礎模型：以ModernBERT為基礎，在CoNLL2003數據集上進行微調，具有良好的泛化能力。

📦 安裝指南

文檔中未提及安裝步驟，可參考Hugging Face Transformers庫的官方安裝指南進行安裝。

💻 使用示例

基礎用法

from transformers import pipeline

ner = pipeline(task="token-classification", model="IsmaelMousa/modernbert-ner-conll2003", aggregation_strategy="max")

results = ner("Hi, I'm Ismael Mousa from Palestine working for NVIDIA inc.")

for entity in results:
    for key, value in entity.items():
        if key == "entity_group":
            print(f"{entity['word']} => {entity[key]}")

運行上述代碼，輸出結果如下：

Ismael Mousa => PER
Palestine => LOC
NVIDIA => ORG

📚 詳細文檔

模型詳情

屬性	詳情
基礎模型	ModernBERT: https://doi.org/10.48550/arXiv.2412.13663
微調數據集	CoNLL2003: https://huggingface.co/datasets/eriktks/conll2003
任務	命名實體識別（NER）

訓練數據

該模型在CoNLL2003數據集上進行了微調，這是一個著名的命名實體識別基準數據集。此數據集為模型在通用英文文本上的泛化提供了堅實的基礎。

訓練超參數

以下是訓練過程中使用的超參數：

學習率：1e-06
訓練批次大小：8
評估批次大小：8
隨機種子：42
優化器：使用adamw_torch，β值為(0.9, 0.999)，ε值為1e-08，無額外優化器參數
學習率調度器類型：線性
訓練輪數：10

訓練結果

訓練損失	輪數	步數	驗證損失	精確率	召回率	F1值	準確率
0.2306	1.0	1756	0.2243	0.6074	0.6483	0.6272	0.9406
0.1415	2.0	3512	0.1583	0.7258	0.7536	0.7394	0.9583
0.1143	3.0	5268	0.1335	0.7731	0.7989	0.7858	0.9657
0.0913	4.0	7024	0.1145	0.7958	0.8256	0.8104	0.9699
0.0848	5.0	8780	0.1079	0.8120	0.8408	0.8261	0.9720
0.0728	6.0	10536	0.1036	0.8214	0.8452	0.8331	0.9730
0.0623	7.0	12292	0.1032	0.8258	0.8487	0.8371	0.9737
0.0599	8.0	14048	0.0990	0.8289	0.8527	0.8406	0.9745
0.0558	9.0	15804	0.0998	0.8331	0.8541	0.8434	0.9750
0.0559	10.0	17560	0.0992	0.8349	0.8563	0.8455	0.9752