B

Bsc Bio Ehr Es

Developed by PlanTL-GOB-ES
針對西班牙語生物醫學和臨床文本優化的預訓練語言模型,支持臨床NLP任務
Downloads 624
Release Time : 4/8/2022

Model Overview

基於RoBERTa架構的西班牙語生物醫學領域專用模型,在混合生物醫學語料和真實臨床記錄上訓練,適用於臨床文本分析任務

Model Features

專業領域優化
在10億token的生物醫學-臨床混合語料上訓練,包含27.8萬份真實臨床文檔
多源數據整合
整合醫學爬蟲、臨床病例、電子健康記錄等11種專業數據源
臨床NER優勢
在PharmaCoNER、CANTEMIST等臨床NER任務上超越通用和多語言模型

Model Capabilities

生物醫學文本理解
臨床實體識別
電子健康記錄分析
醫學文本分類

Use Cases

臨床信息提取
藥物名稱識別
從臨床文本中識別化學藥物提及
在PharmaCoNER任務達到0.8913 F1分數
腫瘤形態學識別
識別西班牙語腫瘤學術語
在CANTEMIST任務達到0.8340 F1分數
電子健康記錄處理
出院報告分析
解析卒中患者出院報告中的臨床變量
在ICTUSnet數據集達到0.8756 F1分數
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase