NuNerZero_onnx開源模型 - 快速精準識別實體，零樣本即用超高效

首頁

Nunerzero Onnx

由deepanwa開發

NuNerZero的ONNX版本，專為使用ONNX Runtime進行快速推理優化的零樣本命名實體識別模型。

序列標註開源協議:MIT #零樣本NER #ONNX加速 #醫療匿名化

下載量 174

發布時間 : 3/22/2025

模型概述

這是一個零樣本命名實體識別（NER）模型，經過ONNX格式轉換以提供高效推理性能，適用於生產環境。

模型特點

高效推理

通過ONNX格式優化，顯著提升推理速度

零樣本能力

無需特定領域訓練即可識別新實體類型

生產就緒

模型經過優化可直接用於生產環境

模型能力

零樣本命名實體識別

多類別實體識別

文本信息提取

使用案例

數據匿名化

個人信息匿名處理

識別並匿名化文本中的個人敏感信息

可有效識別姓名、電話、日期等敏感信息

信息提取

醫療記錄分析

從醫療文本中提取患者信息、診斷結果等實體

🚀 ONNX版NuNerZero模型

本項目提供了NuNerZero的ONNX版本，這是一個零樣本命名實體識別（NER）模型，通過ONNX Runtime進行了優化，可實現快速推理。此次轉換旨在提供高效且適用於生產環境的性能，同時保留NuNerZero模型的原有能力。

該模型是 Zink 的一部分。Zink是一個零樣本匿名化工具，目前使用ONNX版的NuNERZero模型進行匿名化處理。

🚀 快速開始

倉庫內容

model.onnx：用於推理的主要ONNX模型文件。
gliner_config.json：模型的配置設置。
added_tokens.json：分詞器所需的額外標記。
special_tokens_map.json：特殊標記的映射。
tokenizer.json 和 tokenizer_config.json：分詞器的詞彙表和配置文件。
spm.model：分詞器使用的SentencePiece模型文件。

環境要求

Python 3.7 或更高版本
GLiNER – 提供加載和運行模型接口的包。ONNX版本是基於 "gliner==0.2.3" 創建的。

使用示例

以下是一個使用GLiNER加載和使用ONNX模型的快速示例：

from gliner import GLiNER
import time

# 加載ONNX模型和分詞器
model_name="deepanwa/NuNerZero_onnx"
model = GLiNER.from_pretrained(model_name,load_onnx_model=True, load_tokenizer=True)

text = "Dr. Michael, a cardiologist from Canada, was born on 07/04/1970. John Doe dialled his mother at 992-234-3456 and then went out for a walk."
labels = ("person", "profession", "location", "date", "phone number", "relationship", "medical condition", "age")

start = time.time()
result = model.predict_entities(text, labels)
end = time.time()

print("Predicted entities:", result)
print("Time taken:", end - start)