E

Eriberta Base

由HiTZ開發
EriBERTa是一個基於海量醫學臨床語料庫預訓練的雙語領域專用語言模型,在臨床領域超越了既往所有西班牙語模型,展現出卓越的醫學文本理解與信息提取能力。
下載量 728
發布時間 : 6/11/2024

模型概述

面向臨床自然語言處理的雙語預訓練語言模型,支持英語和西班牙語,專注於生物醫學和醫療領域的文本理解與信息提取。

模型特點

雙語醫學專業模型
專門針對英語和西班牙語醫學臨床文本進行預訓練,在醫學領域表現優異
跨語言知識遷移
能夠實現英語和西班牙語之間的知識遷移,特別適合西班牙語臨床數據稀缺的場景
大規模醫學語料訓練
基於多語言醫學語料庫(HiTZ/多語言醫學語料庫)進行預訓練,處理了45億token

模型能力

醫學文本理解
臨床信息提取
雙語文本處理
掩碼語言預測

使用案例

臨床文本分析
醫學報告異常檢測
分析醫學報告中的異常情況,如'全身骨骼X光片未檢測到<mask>異常'
能夠準確預測醫學報告中的專業術語
手術記錄分析
理解手術記錄中的專業術語,如'經皮冠狀動脈<mask>手術'
能夠正確預測手術類型和術語
臨床檢查分析
檢查結果解讀
解讀臨床檢查結果,如'無<mask>或角膜炎跡象'
能夠準確預測檢查結果中的專業醫學術語
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase