O

Openbioner Base

Developed by disi-unibo-nlp
OpenBioNER 是一款專為開放領域生物醫學命名實體識別(NER)定製的輕量級 BERT 模型,僅需目標實體類型的自然語言描述即可識別未見過的實體類型,無需重新訓練。
Downloads 210
Release Time : 4/25/2025

Model Overview

OpenBioNER 通過大語言模型(LLM)自監督生成的合成銀標數據進行預訓練,在零樣本設置下優於 UniNER 和 GPT-4o 等專用 LLM,在多個生物醫學基準測試中 F1 分數最高提升 10%。

Model Features

零樣本學習能力
僅需目標實體類型的自然語言描述即可識別未見過的實體類型,無需重新訓練。
輕量級設計
參數量僅 110M,比 GLiNER 等基線模型減少多達 4 倍,性能卻更優。
高性能表現
在多個生物醫學基準測試中 F1 分數最高提升 10%,超越 GPT-4o 和 UniNER 等模型。

Model Capabilities

生物醫學命名實體識別
零樣本學習
多實體類型識別

Use Cases

生物醫學研究
識別細菌名稱
從生物醫學文獻中識別細菌名稱,如肺炎鏈球菌(Streptococcus pneumoniae)。
在 BC2GM 數據集上 F1 分數達 49.1%
識別化學物質
從化學文獻中識別化學物質名稱。
在 BC4CHEMD 數據集上 F1 分數達 48.0%
醫療信息提取
識別疾病名稱
從臨床文本中識別疾病名稱。
在 NCBI 數據集上 F1 分數達 58.5%
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase