B

Bsc Bio Ehr Es

由PlanTL-GOB-ES開發
針對西班牙語生物醫學和臨床文本優化的預訓練語言模型,支持臨床NLP任務
下載量 624
發布時間 : 4/8/2022

模型概述

基於RoBERTa架構的西班牙語生物醫學領域專用模型,在混合生物醫學語料和真實臨床記錄上訓練,適用於臨床文本分析任務

模型特點

專業領域優化
在10億token的生物醫學-臨床混合語料上訓練,包含27.8萬份真實臨床文檔
多源數據整合
整合醫學爬蟲、臨床病例、電子健康記錄等11種專業數據源
臨床NER優勢
在PharmaCoNER、CANTEMIST等臨床NER任務上超越通用和多語言模型

模型能力

生物醫學文本理解
臨床實體識別
電子健康記錄分析
醫學文本分類

使用案例

臨床信息提取
藥物名稱識別
從臨床文本中識別化學藥物提及
在PharmaCoNER任務達到0.8913 F1分數
腫瘤形態學識別
識別西班牙語腫瘤學術語
在CANTEMIST任務達到0.8340 F1分數
電子健康記錄處理
出院報告分析
解析卒中患者出院報告中的臨床變量
在ICTUSnet數據集達到0.8756 F1分數
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase