distilroberta-base-ner-conll2003开源命名实体识别模型

首页

Distilroberta Base Ner Conll2003

由 philschmid 开发

基于distilroberta-base在conll2003数据集上微调的命名实体识别模型

序列标注

Transformers

开源协议:Apache-2.0 #高精度NER #多语言实体识别 #轻量级RoBERTa

下载量 103

发布时间 : 3/2/2022

模型简介

该模型用于令牌级别的命名实体识别任务，在CoNLL-2003数据集上表现出色，特别适用于英文文本中的实体识别。

模型特点

高性能

在CoNLL-2003数据集上达到95.29的F1分数，表现出优秀的实体识别能力

轻量级

基于DistilRoBERTa架构，相比完整版RoBERTa模型更轻量高效

已验证指标

所有性能指标都经过验证，提供可靠的评估结果

模型能力

命名实体识别

文本标记分类

英文文本处理

使用案例

信息提取

新闻实体识别

从新闻文本中识别人名、地名、组织机构等实体

F1值达到95.29

文档分析

处理法律或商业文档中的关键实体信息

🚀 distilroberta-base-ner-conll2003

该模型是 distilroberta-base 在 conll2003 数据集上的微调版本。它在命名实体识别任务中表现出色，能够准确识别文本中的实体信息。

🚀 快速开始

模型使用示例

from transformers import AutoTokenizer, AutoModelForTokenClassification
from transformers import pipeline

tokenizer = AutoTokenizer.from_pretrained("philschmid/distilroberta-base-ner-conll2003")
model = AutoModelForTokenClassification.from_pretrained("philschmid/distilroberta-base-ner-conll2003")

nlp = pipeline("ner", model=model, tokenizer=tokenizer, grouped_entities=True)
example = "My name is Philipp and live in Germany"

nlp(example)

✨ 主要特性

基于 distilroberta-base 模型微调，在 conll2003 数据集上进行训练。
在命名实体识别任务中表现良好，具有较高的准确率和 F1 分数。

📦 安装指南

文档未提供安装步骤，若需使用该模型，可参考 Hugging Face 官方文档安装相关依赖库。

💻 使用示例

基础用法

from transformers import AutoTokenizer, AutoModelForTokenClassification
from transformers import pipeline

tokenizer = AutoTokenizer.from_pretrained("philschmid/distilroberta-base-ner-conll2003")
model = AutoModelForTokenClassification.from_pretrained("philschmid/distilroberta-base-ner-conll2003")

nlp = pipeline("ner", model=model, tokenizer=tokenizer, grouped_entities=True)
example = "My name is Philipp and live in Germany"

nlp(example)