O

Openbioner Base

由disi-unibo-nlp開發
OpenBioNER 是一款專為開放領域生物醫學命名實體識別(NER)定製的輕量級 BERT 模型,僅需目標實體類型的自然語言描述即可識別未見過的實體類型,無需重新訓練。
下載量 210
發布時間 : 4/25/2025

模型概述

OpenBioNER 通過大語言模型(LLM)自監督生成的合成銀標數據進行預訓練,在零樣本設置下優於 UniNER 和 GPT-4o 等專用 LLM,在多個生物醫學基準測試中 F1 分數最高提升 10%。

模型特點

零樣本學習能力
僅需目標實體類型的自然語言描述即可識別未見過的實體類型,無需重新訓練。
輕量級設計
參數量僅 110M,比 GLiNER 等基線模型減少多達 4 倍,性能卻更優。
高性能表現
在多個生物醫學基準測試中 F1 分數最高提升 10%,超越 GPT-4o 和 UniNER 等模型。

模型能力

生物醫學命名實體識別
零樣本學習
多實體類型識別

使用案例

生物醫學研究
識別細菌名稱
從生物醫學文獻中識別細菌名稱,如肺炎鏈球菌(Streptococcus pneumoniae)。
在 BC2GM 數據集上 F1 分數達 49.1%
識別化學物質
從化學文獻中識別化學物質名稱。
在 BC4CHEMD 數據集上 F1 分數達 48.0%
醫療信息提取
識別疾病名稱
從臨床文本中識別疾病名稱。
在 NCBI 數據集上 F1 分數達 58.5%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase