B

Bioformer 8L

由bioformers開發
專為生物醫學文本挖掘設計的輕量化BERT模型,運行速度是BERT-base的3倍,性能與BioBERT/PubMedBERT相當甚至更優
下載量 164
發布時間 : 3/2/2022

模型概述

Bioformer-8L是一款基於生物醫學領域語料從頭預訓練的輕量化BERT模型,採用生物醫學專用詞彙表,適用於各種生物醫學文本挖掘任務

模型特點

生物醫學專用
完全基於生物醫學領域語料(PubMed摘要和PMC全文)預訓練,採用生物醫學專用詞彙表
高效輕量
參數規模42.8M,運行速度是BERT-base的3倍,在下游任務中保持高性能
全詞掩碼策略
預訓練採用全詞掩碼(whole-word masking)策略,掩碼率15%
專業詞彙覆蓋
詞彙表基於生物醫學文獻訓練,包含32768個token,涵蓋生物醫學特殊符號

模型能力

生物醫學文本理解
掩碼語言建模
生物醫學實體識別
生物醫學文本分類

使用案例

生物醫學研究
疾病概念識別
識別生物醫學文本中的疾病相關概念
在掩碼填充示例中準確識別'糖尿病'等醫學概念
文獻分類
對生物醫學文獻進行多標籤主題分類
在BioCreative VII新冠肺炎分類挑戰賽中取得最佳性能
臨床文本處理
臨床記錄分析
分析臨床記錄中的關鍵醫學信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase