🚀 ONNX版NuNerZero模型
本項目提供了NuNerZero的ONNX版本,這是一個零樣本命名實體識別(NER)模型,通過ONNX Runtime進行了優化,可實現快速推理。此次轉換旨在提供高效且適用於生產環境的性能,同時保留NuNerZero模型的原有能力。
該模型是 Zink 的一部分。Zink是一個零樣本匿名化工具,目前使用ONNX版的NuNERZero模型進行匿名化處理。
🚀 快速開始
倉庫內容
model.onnx
:用於推理的主要ONNX模型文件。
gliner_config.json
:模型的配置設置。
added_tokens.json
:分詞器所需的額外標記。
special_tokens_map.json
:特殊標記的映射。
tokenizer.json
和 tokenizer_config.json
:分詞器的詞彙表和配置文件。
spm.model
:分詞器使用的SentencePiece模型文件。
環境要求
- Python 3.7 或更高版本
- GLiNER – 提供加載和運行模型接口的包。ONNX版本是基於 "gliner==0.2.3" 創建的。
使用示例
以下是一個使用GLiNER加載和使用ONNX模型的快速示例:
from gliner import GLiNER
import time
model_name="deepanwa/NuNerZero_onnx"
model = GLiNER.from_pretrained(model_name,load_onnx_model=True, load_tokenizer=True)
text = "Dr. Michael, a cardiologist from Canada, was born on 07/04/1970. John Doe dialled his mother at 992-234-3456 and then went out for a walk."
labels = ("person", "profession", "location", "date", "phone number", "relationship", "medical condition", "age")
start = time.time()
result = model.predict_entities(text, labels)
end = time.time()
print("Predicted entities:", result)
print("Time taken:", end - start)
✨ 主要特性
- 高效推理:利用ONNX格式,與原始PyTorch實現相比,可顯著加速推理過程。
- 零樣本學習:能夠在未見過的實體類型上進行命名實體識別。
📄 許可證
本項目採用MIT許可證。
🔧 技術細節
本模型基於 numind/NuNER_Zero 進行轉換,屬於零樣本命名實體識別(Zero-shot NER)模型。通過ONNX Runtime進行優化,以實現快速推理。
📚 詳細文檔
重要提示
⚠️ 重要提示
模型文件大小約為1.85GB,請確保在下載時擁有足夠的帶寬和磁盤空間。
引用信息
如需引用本模型,請使用以下信息:10.57967/hf/4902
貢獻說明
歡迎貢獻代碼、提出建議或報告問題。如果您有改進意見,請創建一個issue或提交一個pull request。
信息表格
屬性 |
詳情 |
模型類型 |
ONNX版零樣本命名實體識別(Zero-shot NER)模型 |
基礎模型 |
numind/NuNER_Zero |
所屬項目 |
Zink |