N

Ner Gene Dna Rna Jnlpba Pubmed

由raynardj開發
該模型基於jnlpba數據集訓練,在預訓練的PubMed版RoBERTa模型基礎上微調,專門用於識別基因、DNA、RNA、蛋白質等生物醫學實體
下載量 149
發布時間 : 3/2/2022

模型概述

一個生物醫學領域的命名實體識別模型,能夠從文本中識別基因、DNA、RNA、蛋白質等生物分子實體

模型特點

生物醫學實體識別
專門針對基因、DNA、RNA、蛋白質等生物醫學實體進行優化
基於PubMed數據預訓練
在PubMed生物醫學文獻數據上預訓練,具有領域適應性
簡化標籤系統
移除了傳統的'B-','I-'前綴標記,使用更簡單的標籤系統

模型能力

識別基因實體
識別DNA序列
識別RNA分子
識別蛋白質
識別細胞系
識別細胞類型

使用案例

生物醫學文獻挖掘
基因文獻分析
從生物醫學文獻中提取基因和蛋白質相關信息
可準確識別文獻中提到的各種生物分子實體
生物醫學知識圖譜構建
作為知識圖譜構建的預處理步驟,識別文本中的生物實體
生物信息學研究
實驗數據分析
幫助研究人員從實驗數據描述中提取關鍵生物分子信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase