NuNerZero_onnx开源模型 - 快速精准识别实体，零样本即用超高效

首页

Nunerzero Onnx

由 deepanwa 开发

NuNerZero的ONNX版本，专为使用ONNX Runtime进行快速推理优化的零样本命名实体识别模型。

序列标注开源协议:MIT #零样本NER #ONNX加速 #医疗匿名化

下载量 174

发布时间 : 3/22/2025

模型简介

这是一个零样本命名实体识别（NER）模型，经过ONNX格式转换以提供高效推理性能，适用于生产环境。

模型特点

高效推理

通过ONNX格式优化，显著提升推理速度

零样本能力

无需特定领域训练即可识别新实体类型

生产就绪

模型经过优化可直接用于生产环境

模型能力

零样本命名实体识别

多类别实体识别

文本信息提取

使用案例

数据匿名化

个人信息匿名处理

识别并匿名化文本中的个人敏感信息

可有效识别姓名、电话、日期等敏感信息

信息提取

医疗记录分析

从医疗文本中提取患者信息、诊断结果等实体

🚀 ONNX版NuNerZero模型

本项目提供了NuNerZero的ONNX版本，这是一个零样本命名实体识别（NER）模型，通过ONNX Runtime进行了优化，可实现快速推理。此次转换旨在提供高效且适用于生产环境的性能，同时保留NuNerZero模型的原有能力。

该模型是 Zink 的一部分。Zink是一个零样本匿名化工具，目前使用ONNX版的NuNERZero模型进行匿名化处理。

🚀 快速开始

仓库内容

model.onnx：用于推理的主要ONNX模型文件。
gliner_config.json：模型的配置设置。
added_tokens.json：分词器所需的额外标记。
special_tokens_map.json：特殊标记的映射。
tokenizer.json 和 tokenizer_config.json：分词器的词汇表和配置文件。
spm.model：分词器使用的SentencePiece模型文件。

环境要求

Python 3.7 或更高版本
GLiNER – 提供加载和运行模型接口的包。ONNX版本是基于 "gliner==0.2.3" 创建的。

使用示例

以下是一个使用GLiNER加载和使用ONNX模型的快速示例：

from gliner import GLiNER
import time

# 加载ONNX模型和分词器
model_name="deepanwa/NuNerZero_onnx"
model = GLiNER.from_pretrained(model_name,load_onnx_model=True, load_tokenizer=True)

text = "Dr. Michael, a cardiologist from Canada, was born on 07/04/1970. John Doe dialled his mother at 992-234-3456 and then went out for a walk."
labels = ("person", "profession", "location", "date", "phone number", "relationship", "medical condition", "age")

start = time.time()
result = model.predict_entities(text, labels)
end = time.time()

print("Predicted entities:", result)
print("Time taken:", end - start)