Meditron3 - 8B開源臨床醫學大語言模型，助力資源匱乏地區醫療應用

首頁

Meditron3 8B

由OpenMeditron開發

專注於臨床醫學的大語言模型，特別關注資源匱乏地區和人道主義環境

大型語言模型

Transformers

英語#醫學循證指南 #人道主義醫療 #臨床決策支持

下載量 1,282

發布時間 : 7/11/2024

模型概述

基於Llama-3.1[8B]基礎模型訓練，旨在提升臨床決策與循證醫學信息獲取能力

模型特點

醫學專業領域

專注於臨床醫學，特別關注資源匱乏地區和人道主義環境

多樣化訓練數據

融合臨床指南、醫學期刊、合成診斷數據等多源醫學數據

循證醫學導向

強調可操作的現實世界循證指南

公平代表性

訓練數據注重情境多樣性和公平代表性

模型能力

醫學文本生成

臨床問答

醫學信息檢索

鑑別診斷輔助

使用案例

醫學研究

臨床指南檢索

快速獲取權威臨床實踐指南信息

醫學文獻分析

輔助理解醫學期刊文獻內容

醫學教育

醫學知識問答

回答醫學相關選擇題和理論問題

🚀 模型卡片：Llama-3.1 Meditron-3[8B]

Meditron是一套專門用於臨床醫學的大語言模型。這些模型是與眾多臨床專家和人道主義從業者共同設計的。其訓練過程強調公平的代表性、上下文的多樣性以及基於實際證據的可行指導方針。我們特別注重呈現資源有限地區和人道主義環境、被忽視的人群和疾病。此版本基於Llama-3.1[8B]基礎模型進行訓練，命名為Llama-3.1 Meditron-3[8B]。

📚 詳細文檔

模型詳情

屬性	詳情
開發方	OpenMeditron倡議組織
模型類型	僅因果解碼器的Transformer語言模型
語言	主要為英語
微調基礎模型	Llama-3.1-8B
輸入	僅文本
輸出	僅文本
狀態	這是一個基於離線數據集訓練的靜態模型。隨著我們對模型性能的提升，未來將發佈調優後模型的新版本。

用途

直接使用

Meditron-3是僅用於研究的模型，未經過醫學用途驗證（見下方免責聲明）。

下游應用

Meditron-3是一套尚未進行微調或指令調優的基礎模型。不過，這些模型可以使用諸如基於人類反饋的強化學習（RLHF）或直接偏好優化（DPO）等技術，適配特定的下游任務或應用。在我們對模型的評估中，針對下游問答任務使用了兩種不同的方法：

在提示中添加k個示例進行上下文學習。
使用特定訓練數據集對模型進行問答任務的微調。

訓練數據

這種新的數據混合體包含了專家整理的公開可用數據，並結合了多個來源：

臨床指南：來自世界各地各種醫療相關機構（包括醫院和國際組織）的國際公認臨床實踐指南數據集。
同行評審的醫學出版物：醫學全文文章。
合成鑑別診斷：用於鑑別診斷的類似合成對話的數據。
回放數據：從多個最先進的預訓練和指令調優中採樣的通用領域預訓練數據。
大語言模型增強的醫學多項選擇題：由大語言模型增強的醫學多項選擇題。

關於數據集的更多信息將包含在Meditron-3的出版物中。

評估

Llama[3.1]-Meditron-3[8B]的評估結果即將公佈！

我們使用lm-harness對Meditron進行醫學多項選擇題評估，以確保可重複性。雖然多項選擇題對於評估類似考試的表現很有價值，但它們無法全面體現模型在現實世界中的實用性，特別是在資源匱乏環境中的上下文適應能力。醫學並非簡單的多項選擇題，我們需要超越準確性，評估更細粒度的問題，如同理心、與當地指南的一致性、結構、完整性和安全性。為了解決這個問題，我們開發了一個平臺，直接收集專家的反饋，以不斷適應臨床實踐不斷變化的環境。