🚀 CNER: 概念と固有表現認識
このモデルは、NAACL 2024の論文 CNER: Concept and Named Entity Recognition のためのモデルカードです。Hugging Faceのデフォルトのハイパーパラメータ、オプティマイザ、アーキテクチャを使用して、CNERデータセット で言語モデル (DeBERTa-v3-base) を1エポックファインチューニングしました。したがって、このモデルの結果は論文に示されているものと異なる場合があります。得られたCNERモデルは、細粒度のタグを使用して概念と固有表現を同時に識別および分類することができます。
🚀 クイックスタート
このモデルは、TransformersのNER pipeline を使って利用することができます。
基本的な使用法
from transformers import AutoTokenizer, AutoModelForTokenClassification
from transformers import pipeline
tokenizer = AutoTokenizer.from_pretrained("Babelscape/cner-model")
model = AutoModelForTokenClassification.from_pretrained("Babelscape/cner-model")
nlp = pipeline("ner", model=model, tokenizer=tokenizer, grouped_entities=True)
example = "What is the seventh tallest mountain in North America?"
ner_results = nlp(example)
print(ner_results)
✨ 主な機能
情報一覧
項目 |
詳細 |
注釈作成者 |
機械生成 |
言語作成者 |
機械生成 |
ウィジェット |
- text: George Washington went to Washington. - text: What is the seventh tallest mountain in North America? |
タグ |
- 固有表現認識 - シーケンスタガーモデル |
データセット |
- Babelscape/cner |
言語 |
- en |
表示名 |
cner-model |
ソースデータセット |
- original |
タスクカテゴリ |
- 構造予測 |
タスクID |
- 固有表現認識 |
クラス
📄 ライセンス
このリポジトリの内容は、Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License (CC BY-NC-SA 4.0) の下で、非商用の研究目的のみに制限されています。データセットの内容とモデルの著作権は、元の著作権者に帰属します。
microsoft/deberta-v3-base
は MITライセンス の下でリリースされています。
引用情報
このモデルを使用する場合は、論文でこの研究を引用してください:
@inproceedings{martinelli-etal-2024-cner,
title = "{CNER}: Concept and Named Entity Recognition",
author = "Martinelli, Giuliano and
Molfese, Francesco and
Tedeschi, Simone and
Fern{\'a}ndez-Castro, Alberte and
Navigli, Roberto",
editor = "Duh, Kevin and
Gomez, Helena and
Bethard, Steven",
booktitle = "Proceedings of the 2024 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies (Volume 1: Long Papers)",
month = jun,
year = "2024",
address = "Mexico City, Mexico",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2024.naacl-long.461",
pages = "8329--8344",
}
論文の元のリポジトリは https://github.com/Babelscape/cner で見つけることができます。