B

Bsc Bio Es

由PlanTL-GOB-ES開發
專為西班牙語生物醫學領域設計的預訓練語言模型,適用於臨床NLP任務
下載量 162
發布時間 : 4/8/2022

模型概述

基於RoBERTa架構的生物醫學領域專用模型,在9.63億詞元的西班牙語生物醫學語料上訓練,支持掩碼語言建模任務,特別適合臨床文本處理

模型特點

領域專業化
專門針對西班牙語生物醫學文本訓練,包含臨床病例、醫學文獻等專業語料
高性能表現
在PharmaCoNER等三項臨床NER任務上超越通用和多語言模型
大規模訓練數據
使用9.63億詞元的清洗後生物醫學語料訓練,包含醫療爬蟲、臨床病例、專利數據等多源數據

模型能力

生物醫學文本理解
臨床實體識別
醫學文本分類
醫學文本填空補全

使用案例

臨床信息提取
藥物名稱識別
從臨床文本中識別化學與藥物提及
在PharmaCoNER任務上達到0.8907 F1分數
腫瘤術語識別
識別西班牙語腫瘤形態學術語
在CANTEMIST任務上達到0.8220 F1分數
臨床文檔分析
出院報告分析
處理卒中患者出院報告中的臨床變量
在ICTUSnet數據集上達到0.8727 F1分數
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase