R

Roberta Base Biomedical Es

由PlanTL-GOB-ES開發
專為西班牙語生物醫學領域設計的RoBERTa架構預訓練語言模型,適用於臨床文本處理任務
下載量 335
發布時間 : 3/2/2022

模型概述

基於RoBERTa架構的中等規模生物醫學語言模型,在9.63億標記的西班牙語生物醫學語料上訓練,支持掩碼語言建模任務,特別適合生物醫學文本的命名實體識別和文本分類

模型特點

領域專業化
專門針對西班牙語生物醫學領域優化,在臨床文本處理上表現優於通用模型
高質量語料
使用經過嚴格清洗的9.63億標記生物醫學語料訓練,整合了多個權威醫學數據源
高效訓練
採用與原始RoBERTa相同的訓練參數,在16塊V100 GPU上僅需48小時完成訓練

模型能力

生物醫學文本填空
臨床命名實體識別
醫學文本分類
生物醫學信息抽取

使用案例

臨床文檔處理
病史自動補全
自動補全臨床記錄中的專業術語
示例顯示對'動脈<mask>'的補全準確率達98.5%
放射學報告分析
識別影像報告中的異常描述
在骨骼X光報告中準確識別異常描述
醫學研究
文獻信息抽取
從醫學文獻中提取關鍵臨床信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase