S

Sd Ner

由EMBO開發
基於RoBERTa基礎模型,在生命科學領域英文科學文本上進行微調的命名實體識別模型
下載量 14
發布時間 : 3/2/2022

模型概述

該模型專門用於識別SourceData標註系統中的生物實體,包括小分子、基因產物、亞細胞組分等7類生物醫學實體

模型特點

生物醫學領域專用
針對生命科學文獻進行優化,能準確識別生物醫學實體
多類別實體識別
可識別7類生物醫學實體,包括基因產物、小分子等
基於RoBERTa優化
在RoBERTa基礎模型上通過生物醫學語料庫進一步訓練

模型能力

生物醫學實體識別
科學文本分析
多類別分類

使用案例

生物醫學文獻分析
科研論文實體提取
從生命科學領域的論文中提取關鍵生物實體
F1值達0.74(微觀平均)
實驗數據標註
自動標註實驗方法、細胞類型等關鍵信息
基因產物識別F1值達0.82
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase