B

Biom ALBERT Xxlarge PMC

由sultan開發
基於BERT、ALBERT和ELECTRA構建的大型生物醫學語言模型,在多項生物醫學任務中取得最先進成果
下載量 189
發布時間 : 3/2/2022

模型概述

BioM-Transformers是一個針對生物醫學領域優化的Transformer模型系列,通過不同架構選擇在生物醫學文本處理任務中展現卓越性能。模型在PMC全文數據上進行預訓練,支持多種生物醫學NLP任務。

模型特點

多架構支持
同時提供基於BERT、ALBERT和ELECTRA的不同架構變體,滿足不同應用場景需求
高效TPU支持
提供PyTorch XLA和JAX/Flax實現,可利用Google Colab和Kaggle的免費TPU資源進行微調
生物醫學領域優化
在PMC全文數據上進行額外64k步預訓練,專門針對生物醫學文本特性優化
計算效率
在相當或更低計算成本下取得優於同類模型的性能表現

模型能力

生物醫學文本分類
生物醫學命名實體識別
生物醫學問答系統
生物醫學關係抽取

使用案例

生物醫學文獻處理
ChemProt關係分類
化學-蛋白質相互作用分類任務
微平均F1分數80.74(5個epoch微調耗時43分鐘)
BioASQ生物醫學問答
回答生物醫學領域事實型問題
臨床文本分析
臨床命名實體識別
識別臨床文本中的醫學實體
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase