B

Bsc Bio Es

Developed by PlanTL-GOB-ES
專為西班牙語生物醫學領域設計的預訓練語言模型,適用於臨床NLP任務
Downloads 162
Release Time : 4/8/2022

Model Overview

基於RoBERTa架構的生物醫學領域專用模型,在9.63億詞元的西班牙語生物醫學語料上訓練,支持掩碼語言建模任務,特別適合臨床文本處理

Model Features

領域專業化
專門針對西班牙語生物醫學文本訓練,包含臨床病例、醫學文獻等專業語料
高性能表現
在PharmaCoNER等三項臨床NER任務上超越通用和多語言模型
大規模訓練數據
使用9.63億詞元的清洗後生物醫學語料訓練,包含醫療爬蟲、臨床病例、專利數據等多源數據

Model Capabilities

生物醫學文本理解
臨床實體識別
醫學文本分類
醫學文本填空補全

Use Cases

臨床信息提取
藥物名稱識別
從臨床文本中識別化學與藥物提及
在PharmaCoNER任務上達到0.8907 F1分數
腫瘤術語識別
識別西班牙語腫瘤形態學術語
在CANTEMIST任務上達到0.8220 F1分數
臨床文檔分析
出院報告分析
處理卒中患者出院報告中的臨床變量
在ICTUSnet數據集上達到0.8727 F1分數
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase