🚀 ONNX版NuNerZero模型
本项目提供了NuNerZero的ONNX版本,这是一个零样本命名实体识别(NER)模型,通过ONNX Runtime进行了优化,可实现快速推理。此次转换旨在提供高效且适用于生产环境的性能,同时保留NuNerZero模型的原有能力。
该模型是 Zink 的一部分。Zink是一个零样本匿名化工具,目前使用ONNX版的NuNERZero模型进行匿名化处理。
🚀 快速开始
仓库内容
model.onnx
:用于推理的主要ONNX模型文件。
gliner_config.json
:模型的配置设置。
added_tokens.json
:分词器所需的额外标记。
special_tokens_map.json
:特殊标记的映射。
tokenizer.json
和 tokenizer_config.json
:分词器的词汇表和配置文件。
spm.model
:分词器使用的SentencePiece模型文件。
环境要求
- Python 3.7 或更高版本
- GLiNER – 提供加载和运行模型接口的包。ONNX版本是基于 "gliner==0.2.3" 创建的。
使用示例
以下是一个使用GLiNER加载和使用ONNX模型的快速示例:
from gliner import GLiNER
import time
model_name="deepanwa/NuNerZero_onnx"
model = GLiNER.from_pretrained(model_name,load_onnx_model=True, load_tokenizer=True)
text = "Dr. Michael, a cardiologist from Canada, was born on 07/04/1970. John Doe dialled his mother at 992-234-3456 and then went out for a walk."
labels = ("person", "profession", "location", "date", "phone number", "relationship", "medical condition", "age")
start = time.time()
result = model.predict_entities(text, labels)
end = time.time()
print("Predicted entities:", result)
print("Time taken:", end - start)
✨ 主要特性
- 高效推理:利用ONNX格式,与原始PyTorch实现相比,可显著加速推理过程。
- 零样本学习:能够在未见过的实体类型上进行命名实体识别。
📄 许可证
本项目采用MIT许可证。
🔧 技术细节
本模型基于 numind/NuNER_Zero 进行转换,属于零样本命名实体识别(Zero-shot NER)模型。通过ONNX Runtime进行优化,以实现快速推理。
📚 详细文档
重要提示
⚠️ 重要提示
模型文件大小约为1.85GB,请确保在下载时拥有足够的带宽和磁盘空间。
引用信息
如需引用本模型,请使用以下信息:10.57967/hf/4902
贡献说明
欢迎贡献代码、提出建议或报告问题。如果您有改进意见,请创建一个issue或提交一个pull request。
信息表格
属性 |
详情 |
模型类型 |
ONNX版零样本命名实体识别(Zero-shot NER)模型 |
基础模型 |
numind/NuNER_Zero |
所属项目 |
Zink |