🚀 CNER:概念與命名實體識別
本項目聚焦於概念與命名實體識別,通過微調語言模型,能夠聯合識別並分類概念和命名實體,使用細粒度標籤進行標註,為自然語言處理領域的相關任務提供了有力支持。
🚀 快速開始
本項目是關於NAACL 2024論文CNER:概念與命名實體識別的模型卡片。我們使用Hugging Face的默認超參數、優化器和架構,在CNER數據集上對語言模型(DeBERTa - v3 - base)進行了1個epoch的微調,因此該模型的結果可能與論文中呈現的結果有所不同。最終得到的CNER模型能夠使用細粒度標籤聯合識別和分類概念與命名實體。
如果您使用了該模型,請在您的論文中引用此項工作:
@inproceedings{martinelli-etal-2024-cner,
title = "{CNER}: Concept and Named Entity Recognition",
author = "Martinelli, Giuliano and
Molfese, Francesco and
Tedeschi, Simone and
Fern{\'a}ndez-Castro, Alberte and
Navigli, Roberto",
editor = "Duh, Kevin and
Gomez, Helena and
Bethard, Steven",
booktitle = "Proceedings of the 2024 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (Volume 1: Long Papers)",
month = jun,
year = "2024",
address = "Mexico City, Mexico",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2024.naacl-long.461",
pages = "8329--8344",
}
論文的原始倉庫可在https://github.com/Babelscape/cner找到。
✨ 主要特性
- 能夠聯合識別和分類概念與命名實體。
- 使用細粒度標籤進行標註。
📦 安裝指南
暫未提及具體安裝步驟,可參考Hugging Face相關庫的安裝方式。
💻 使用示例
基礎用法
from transformers import AutoTokenizer, AutoModelForTokenClassification
from transformers import pipeline
tokenizer = AutoTokenizer.from_pretrained("Babelscape/cner-model")
model = AutoModelForTokenClassification.from_pretrained("Babelscape/cner-model")
nlp = pipeline("ner", model=model, tokenizer=tokenizer, grouped_entities=True)
example = "What is the seventh tallest mountain in North America?"
ner_results = nlp(example)
print(ner_results)
📚 詳細文檔
類別

📄 許可證
此倉庫的內容僅可用於非商業研究目的,遵循知識共享署名 - 非商業性使用 - 相同方式共享4.0國際許可協議(CC BY - NC - SA 4.0)。數據集內容和模型的版權歸原始版權持有者所有。
microsoft/deberta - v3 - base
根據MIT許可證發佈。
信息表格
屬性 |
詳情 |
標註創建者 |
機器生成 |
語言創建者 |
機器生成 |
標籤 |
命名實體識別、序列標註模型 |
數據集 |
Babelscape/cner |
語言 |
英語 |
任務類別 |
結構預測 |
任務ID |
命名實體識別 |