🚀 GLiNER-BioMed
GLiNER-BioMed是一套高效的開放生物醫學命名實體識別模型。它基於GLiNER框架,利用從大型生成式生物醫學語言模型中提取的合成註釋,在生物醫學實體識別任務中實現了零樣本和少樣本的先進性能。該模型為傳統命名實體識別模型和大語言模型提供了實用的替代方案。
🚀 快速開始
GLiNER-BioMed是專門用於生物醫學命名實體識別的模型,下面將指導你如何快速使用它。
✨ 主要特性
- 廣泛的實體識別能力:GLiNER能夠識別任何實體類型,突破了傳統NER模型只能識別預定義實體的限制。
- 高效性能:GLiNER-biomed基於GLiNER框架,引入了一套高效的開放生物醫學NER模型,在零樣本和少樣本的生物醫學實體識別任務中表現出色。
- 合成註釋的利用:該模型利用從大型生成式生物醫學語言模型中提取的合成註釋,提升了模型的性能。
📦 安裝指南
使用pip安裝官方的GLiNER庫:
pip install gliner -U
💻 使用示例
基礎用法
安裝GLiNER庫後,你可以輕鬆加載GLiNER-biomed模型並執行命名實體識別:
from gliner import GLiNER
model = GLiNER.from_pretrained("Ihor/gliner-biomed-bi-base-v1.0")
text = """
The patient, a 45-year-old male, was diagnosed with type 2 diabetes mellitus and hypertension.
He was prescribed Metformin 500mg twice daily and Lisinopril 10mg once daily.
A recent lab test showed elevated HbA1c levels at 8.2%.
"""
labels = ["Disease", "Drug", "Drug dosage", "Drug frequency", "Lab test", "Lab test value", "Demographic information"]
entities = model.predict_entities(text, labels, threshold=0.5)
for entity in entities:
print(entity["text"], "=>", entity["label"])
高級用法
如果你有大量實體並希望預先嵌入它們,請參考以下代碼片段:
labels = ["your entities"]
texts = ["your texts"]
entity_embeddings = model.encode_labels(labels, batch_size = 8)
outputs = model.batch_predict_with_embeds(texts, entity_embeddings, labels)
📚 詳細文檔
模型基準測試
我們在8個複雜的真實世界數據集上對模型進行了測試,並與其他GLiNER模型進行了比較。
加入我們的Discord社區
在Discord上與我們的社區聯繫,獲取有關我們模型的最新消息、支持和討論。點擊Discord加入。
📄 許可證
本項目採用Apache-2.0許可證。
📚 引用信息
本工作
如果你在工作中使用了GLiNER-biomed模型,請引用以下文獻:
@misc{yazdani2025glinerbiomedsuiteefficientmodels,
title={GLiNER-biomed: A Suite of Efficient Models for Open Biomedical Named Entity Recognition},
author={Anthony Yazdani and Ihor Stepanov and Douglas Teodoro},
year={2025},
eprint={2504.00676},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2504.00676},
}
先前工作
@misc{zaratiana2023gliner,
title={GLiNER: Generalist Model for Named Entity Recognition using Bidirectional Transformer},
author={Urchade Zaratiana and Nadi Tomeh and Pierre Holat and Thierry Charnois},
year={2023},
eprint={2311.08526},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
@misc{stepanov2024gliner,
title={GLiNER multi-task: Generalist Lightweight Model for Various Information Extraction Tasks},
author={Ihor Stepanov and Mykhailo Shtopko},
year={2024},
eprint={2406.12925},
archivePrefix={arXiv},
primaryClass={id='cs.LG' full_name='Machine Learning' is_active=True alt_name=None in_archive='cs' is_general=False description='Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.'}
}