BioMistral-7B开源医疗大语言模型 - 经预训练免费助力医疗领域问答

Home

Biomistral 7B DARE AWQ QGS128 W4 GEMM

Developed by BioMistral

基于Mistral架构的医疗领域开源大语言模型，通过PubMed Central文本继续预训练

大型语言模型

Transformers

#医疗问答 #多语言医学评估 #PubMed预训练

Downloads 135

Release Time : 2/17/2024

Model Overview

BioMistral是针对医疗健康领域优化的开源大语言模型套件，基于Mistral-7B架构，使用PubMed Central开放获取文本进行继续预训练，在医学问答任务中表现优异。

Model Features

医疗领域专业化

通过PubMed Central高质量医学文献继续预训练，增强生物医学知识理解能力

多模型融合策略

提供DARE/TIES/SLERP三种融合变体模型，提升模型性能

高效量化版本

支持AWQ/BnB等多种量化方法，最低仅需4.68GB显存即可运行

多语言评估基准

首次在医疗领域进行大规模多语言(8种语言)LLM评估

Model Capabilities

医学问答

生物医学文本理解

医学知识推理

多语言医学文本处理

Use Cases

医学教育

医学考试题目解答

解答USMLE等医学考试题目

在MedQA等基准测试中准确率优于多数开源医疗模型

临床研究支持

医学文献分析

帮助研究人员快速理解医学文献内容

🚀 BioMistral：用于医学领域的开源预训练大语言模型集合

BioMistral是一系列专为医学领域打造的开源预训练大语言模型，以Mistral为基础模型，并在PubMed Central上进行了进一步预训练。它在多个医学问答任务中表现出色，优于现有的开源医学模型，甚至在与专有模型的竞争中也不落下风。

🚀 快速开始

你可以使用Hugging Face的Transformers库来使用BioMistral，以下是加载模型和分词器的示例代码：

from transformers import AutoModel, AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("BioMistral/BioMistral-7B")
model = AutoModel.from_pretrained("BioMistral/BioMistral-7B")

✨ 主要特性

专为医学领域定制：基于Mistral模型，在PubMed Central的文本数据上进一步预训练，更适应医学领域的专业需求。
多语言评估：对基准测试进行了7种语言的自动翻译和评估，实现了医学领域大语言模型的首次大规模多语言评估。
多种模型变体：提供了不同合并策略的模型，如DARE、TIES和SLERP，以及量化模型，满足不同场景的需求。

📦 安装指南

文档未提及具体安装步骤，可参考Hugging Face的Transformers库的安装方法。

💻 使用示例

基础用法

from transformers import AutoModel, AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("BioMistral/BioMistral-7B")
model = AutoModel.from_pretrained("BioMistral/BioMistral-7B")

📚 详细文档

BioMistral模型

BioMistral是一套基于Mistral的进一步预训练的开源模型，适用于医学领域，使用了来自PubMed Central Open Access（CC0、CC BY、CC BY - SA和CC BY - ND）的文本数据进行预训练。所有模型均使用法国国家科学研究中心（CNRS）的Jean Zay法国高性能计算机进行训练。

属性	详情
模型类型	基于Mistral的进一步预训练模型
训练数据	PubMed Central Open Access的文本数据

具体模型信息如下：

模型名称	基础模型	模型类型	序列长度	下载地址
BioMistral - 7B	[Mistral - 7B - Instruct - v0.1](https://huggingface.co/mistralai/Mistral - 7B - Instruct - v0.1)	进一步预训练	2048	[HuggingFace](https://huggingface.co/BioMistral/BioMistral - 7B)
BioMistral - 7B - DARE	[Mistral - 7B - Instruct - v0.1](https://huggingface.co/mistralai/Mistral - 7B - Instruct - v0.1)	合并DARE	2048	[HuggingFace](https://huggingface.co/BioMistral/BioMistral - 7B - DARE)
BioMistral - 7B - TIES	[Mistral - 7B - Instruct - v0.1](https://huggingface.co/mistralai/Mistral - 7B - Instruct - v0.1)	合并TIES	2048	[HuggingFace](https://huggingface.co/BioMistral/BioMistral - 7B - TIES)
BioMistral - 7B - SLERP	[Mistral - 7B - Instruct - v0.1](https://huggingface.co/mistralai/Mistral - 7B - Instruct - v0.1)	合并SLERP	2048	[HuggingFace](https://huggingface.co/BioMistral/BioMistral - 7B - SLERP)

量化模型

基础模型	方法	q_group_size	w_bit	版本	VRAM GB	时间	下载地址
BioMistral - 7B	FP16/BF16				15.02	x1.00	[HuggingFace](https://huggingface.co/BioMistral/BioMistral - 7B)
BioMistral - 7B	AWQ	128	4	GEMM	4.68	x1.41	[HuggingFace](https://huggingface.co/BioMistral/BioMistral - 7B - AWQ - QGS128 - W4 - GEMM)
BioMistral - 7B	AWQ	128	4	GEMV	4.68	x10.30	[HuggingFace](https://huggingface.co/BioMistral/BioMistral - 7B - AWQ - QGS128 - W4 - GEMV)
BioMistral - 7B	BnB.4		4		5.03	x3.25	HuggingFace
BioMistral - 7B	BnB.8		8		8.04	x4.34	HuggingFace
BioMistral - 7B - DARE	AWQ	128	4	GEMM	4.68	x1.41	[HuggingFace](https://huggingface.co/BioMistral/BioMistral - 7B - DARE - AWQ - QGS128 - W4 - GEMM)
BioMistral - 7B - TIES	AWQ	128	4	GEMM	4.68	x1.41	[HuggingFace](https://huggingface.co/BioMistral/BioMistral - 7B - TIES - AWQ - QGS128 - W4 - GEMM)
BioMistral - 7B - SLERP	AWQ	128	4	GEMM	4.68	x1.41	[HuggingFace](https://huggingface.co/BioMistral/BioMistral - 7B - SLERP - AWQ - QGS128 - W4 - GEMM)

监督微调基准测试

	临床知识图谱	医学遗传学	解剖学	专业医学	大学生物学	大学医学	MedQA	MedQA 5选项	PubMedQA	MedMCQA	平均
BioMistral 7B	59.9	64.0	56.5	60.4	59.0	54.7	50.6	42.8	77.5	48.1	57.3
Mistral 7B Instruct	62.9	57.0	55.6	59.4	62.5	57.2	42.0	40.9	75.7	46.1	55.9

BioMistral 7B Ensemble	62.8	62.7	57.5	63.5	64.3	55.7	50.6	43.6	77.5	48.8	58.7
BioMistral 7B DARE	62.3	67.0	55.8	61.4	66.9	58.0	51.1	45.2	77.7	48.7	59.4
BioMistral 7B TIES	60.1	65.0	58.5	60.5	60.4	56.5	49.5	43.2	77.5	48.1	57.9
BioMistral 7B SLERP	62.5	64.7	55.8	62.7	64.8	56.3	50.8	44.3	77.8	48.6	58.8

MedAlpaca 7B	53.1	58.0	54.1	58.8	58.1	48.6	40.1	33.7	73.6	37.0	51.5
PMC - LLaMA 7B	24.5	27.7	35.3	17.4	30.3	23.3	25.5	20.2	72.9	26.6	30.4
MediTron - 7B	41.6	50.3	46.4	27.9	44.4	30.8	41.6	28.1	74.9	41.3	42.7
BioMedGPT - LM - 7B	51.4	52.0	49.4	53.3	50.7	49.1	42.5	33.9	76.8	37.6	49.7

GPT - 3.5 Turbo 1106*	74.71	74.00	65.92	72.79	72.91	64.73	57.71	50.82	72.66	53.79	66.0

BioMistral 7B模型与基线模型的监督微调（SFT）性能对比，通过准确率（↑）衡量，并在3次3 - shot随机种子上取平均值。DARE、TIES和SLERP是结合BioMistral 7B和Mistral 7B Instruct的模型合并策略。最佳模型用粗体表示，第二佳模型用下划线表示。*GPT - 3.5 Turbo的性能报告来自未进行SFT的3 - shot结果。

🔧 技术细节

文档未提供详细的技术实现细节。

📄 许可证

文档未提及许可证信息。

引用信息

Arxiv链接：https://arxiv.org/abs/2402.10373

@misc{labrak2024biomistral,
      title={BioMistral: A Collection of Open-Source Pretrained Large Language Models for Medical Domains}, 
      author={Yanis Labrak and Adrien Bazoge and Emmanuel Morin and Pierre-Antoine Gourraud and Mickael Rouvier and Richard Dufour},
      year={2024},
      eprint={2402.10373},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

重要提示

⚠️ 重要提示

尽管BioMistral旨在封装来自高质量证据的医学知识，但它尚未针对在专业参数范围内有效、安全或适当地传达这些知识进行定制。除非经过与特定用例的彻底对齐和进一步测试，特别是包括在现实世界医学环境中的随机对照试验，否则我们建议不要在医学环境中使用BioMistral。BioMistral 7B可能存在尚未彻底评估的固有风险和偏差。此外，该模型的性能尚未在现实世界的临床环境中进行评估。因此，我们建议仅将BioMistral 7B作为研究工具使用，并建议不要将其部署在生产环境中用于自然语言生成或任何专业健康和医学目的。