B

Biomedvlp BioViL T

由microsoft開發
BioViL-T是一個專注於分析胸部X光片和放射學報告的視覺語言模型,通過時序多模態預訓練提升性能。
下載量 26.39k
發布時間 : 2/17/2023

模型概述

BioViL-T是一個領域特定的視覺語言模型,專注於胸部X光片(CXRs)和放射學報告的分析。該模型採用時序多模態預訓練方法,在圖像和文本模態以及聯合空間中嵌入時序信息,顯著提升了多個下游任務的性能。

模型特點

時序多模態預訓練
充分利用數據點之間的時序結構,在保持相同訓練數據集的情況下提升下游任務性能。
跨模態對齊
利用[CLS]標記的潛在表徵對齊文本和圖像嵌入,實現更好的跨模態理解。
領域特定優化
專門針對胸部X光片和放射學報告領域進行優化,在相關任務上表現優異。
兩階段訓練
語言模型先進行通用生物醫學領域預訓練,再進行放射學領域特定訓練,提高專業性。

模型能力

胸部X光片分析
放射學報告理解
自然語言推理
短語定位
圖像分類
文本分類
語言解碼
跨模態檢索

使用案例

醫學影像分析
胸部X光片異常檢測
分析胸部X光片並檢測異常情況,如胸腔積液或氣胸。
在MS-CXR-T基準測試上達到87.77%的準確率
放射學報告生成
根據胸部X光片生成或補充放射學報告。
醫學研究
醫學影像語言處理研究
支持AI研究人員探索臨床NLP和VLP研究問題。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase