MMedLM開源多語言醫療基礎模型 - 助力醫療領域信息處理與應用

首頁

Mmedlm

由Henrychur開發

MMedLM是一個擁有70億參數的多語言醫療基礎模型，基於InternLM架構，在綜合多語言醫療語料庫MMedC上進行了預訓練。

大型語言模型

Transformers

支持多種語言開源協議:Apache-2.0 #多語言醫療 #70億參數 #醫療知識增強

下載量 30

發布時間 : 2/20/2024

模型概述

MMedLM是一個多語言醫療語言模型，旨在增強醫療領域的知識理解和處理能力，支持多種語言。

模型特點

多語言支持

支持包括英文、中文、日語、法語、俄語和西班牙語在內的多種語言。

醫療領域優化

在綜合多語言醫療語料庫MMedC上進行了預訓練，增強了醫療領域的知識理解和處理能力。

高性能

在MMedBench評測中表現出色，尤其在中文和俄語醫療問答任務中表現優異。

模型能力

醫療文本理解

多語言醫療問答

醫療文本生成

使用案例

醫療問答

多語言醫療諮詢

為不同語言的用戶提供醫療諮詢服務。

在MMedBench評測中表現優異，尤其在中文和俄語任務中。

醫療文本生成

醫療報告生成

根據輸入的醫療數據生成結構化的報告。

🚀 MMedLM

MMedLM是一個多語言醫學基礎模型，為醫學領域提供了強大的語言處理能力，基於InternLM進一步預訓練，增強了醫學領域知識。

🚀 快速開始

本倉庫包含MMedLM，一個擁有70億參數的多語言醫學基礎模型。MMedLM基於InternLM構建，並在MMedC（一個全面的多語言醫學語料庫）上進行了進一步的預訓練，這增強了模型在醫學領域的知識。

模型在MMedC上進行進一步預訓練時使用了以下超參數：

迭代次數：15000
全局批次大小：512
截斷長度：2048
學習率：2e - 5

可以按如下方式加載模型：

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("Henrychur/MMedLM", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("Henrychur/MMedLM", torch_dtype=torch.float16, trust_remote_code=True)

⚠️ 重要提示

這是一個未經指令微調的基礎模型。測試發現，使用最新版本的transformers會導致錯誤，建議使用transformers==4.28.1。

✨ 主要特性

多語言支持：支持英語、中文、日語、法語、俄語和西班牙語等多種語言。
醫學領域增強：基於InternLM，在MMedC上進一步預訓練，增強醫學領域知識。
性能優越：MMedLM 2在MMedBench上的表現優於許多開源模型，甚至可與GPT - 4相媲美。

📚 詳細文檔

MMedBench評估結果

進一步預訓練的MMedLM 2在不同語言的醫學領域中展現出了出色的性能。

方法	規模	年份	MMedC	MMedBench	英語	中文	日語	法語	俄語	西班牙語	平均
GPT - 3.5	-	2022.12	❌	❌	56.88	52.29	34.63	32.48	66.36	66.06	51.47
GPT - 4	-	2023.3	❌	❌	78.00	75.07	72.91	56.59	83.62	85.67	74.27
Gemini - 1.0 pro	-	2024.1	❌	❌	53.73	60.19	44.22	29.90	73.44	69.69	55.20
BLOOMZ	7B	2023.5	❌	訓練集	43.28	58.06	32.66	26.37	62.89	47.34	45.10
InternLM	7B	2023.7	❌	訓練集	44.07	64.62	37.19	24.92	58.20	44.97	45.67
Llama 2	7B	2023.7	❌	訓練集	43.36	50.29	25.13	20.90	66.80	47.10	42.26
MedAlpaca	7B	2023.3	❌	訓練集	46.74	44.80	29.64	21.06	59.38	45.00	41.11
ChatDoctor	7B	2023.4	❌	訓練集	43.52	43.26	25.63	18.81	62.50	43.44	39.53
PMC - LLaMA	7B	2023.4	❌	訓練集	47.53	42.44	24.12	20.74	62.11	43.29	40.04
Mistral	7B	2023.10	❌	訓練集	61.74	71.10	44.72	48.71	74.22	63.86	60.73
InternLM 2	7B	2024.2	❌	訓練集	57.27	77.55	47.74	41.00	68.36	59.59	58.59
MMedLM(我們的)	7B	-	❌	訓練集	49.88	70.49	46.23	36.66	72.27	54.52	55.01
MMedLM 2(我們的)	7B	-	❌	訓練集	61.74	80.01	61.81	52.09	80.47	67.65	67.30

GPT和Gemini通過API在零樣本設置下進行評估。
開源模型在MMedBench的訓練集上進行訓練後再進行評估。

📄 許可證

本項目採用Apache - 2.0許可證。

👨‍💻 聯繫我們

如果您有任何問題，請隨時聯繫qiupengcheng@pjlab.org.cn。

📚 引用

@misc{qiu2024building,
      title={Towards Building Multilingual Language Model for Medicine}, 
      author={Pengcheng Qiu and Chaoyi Wu and Xiaoman Zhang and Weixiong Lin and Haicheng Wang and Ya Zhang and Yanfeng Wang and Weidi Xie},
      year={2024},
      eprint={2402.13963},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}