🚀 Medra:您的紧凑型医学推理伙伴
Medra是一款专门打造的轻量级医学语言模型,旨在辅助临床推理、医学教育以及对话建模。它基于Gemma 3构建,是创建可部署、可解释且符合伦理的医学人工智能支持系统这一长期项目的第一步。该模型体积小巧,可在消费级硬件上运行;功能强大,能处理细致的医学提示;且坚守原则,绝不妄图取代人类的判断。
属性 |
详情 |
模型类型 |
Medra v1(Gemma版) |
模型大小 |
4b |
格式 |
GGUF(Q4、Q8、BF16) |
许可证 |
Apache 2.0 |
作者 |
Dr. Alexandru Lupoi |
基础模型 |
unsloth/gemma-3-4b-it-qat-unsloth-bnb-4bit |
训练数据集 |
qiaojin/PubMedQA、Mreeb/Dermatology-Question-Answer-Dataset-For-Fine-Tuning、lavita/MedQuAD |
标签 |
text-generation、medical-ai、question-answering、summarization、dermatology、gemma-3、qlora、unsloth、fine-tuned |
任务类型 |
text-generation |

🚀 快速开始
模型概述
Medra 是专门为临床推理、医学教育和对话建模而设计的轻量级医学语言模型。基于 Gemma 3 构建,它是创建可部署、可解释且符合伦理的医学人工智能支持系统这一长期项目的第一步。
它体积小巧,可在消费级硬件上运行;功能强大,能处理细致的医学提示;且坚守原则,绝不妄图取代人类的判断。
Medra 并非聊天机器人,而是一种 认知工具,是学生、临床医生和研究人员探索人工智能如何在不简化医疗复杂性的前提下提供帮助的推理伙伴。
目的与理念
Medra 的开发旨在填补当前人工智能领域的关键空白:
虽然许多通用大语言模型在开放领域对话方面表现出色,但很少有模型针对 结构化的医学相关推理 进行优化。更少的模型能够 本地、离线且实时运行,特别是在无法访问大型模型或这样做不符合伦理的环境中。
Medra 旨在提供:
- 用于病例模拟和回顾的可解释输出
- 支持鉴别诊断探索
- 为医学生提供反思伙伴
- 为实际临床环境中的推理改进提供框架
该项目基于这样一种信念:医疗领域的人工智能必须 透明、具有教育意义 且 辅助人类决策,而不是自主、掠夺性或误导性的。
主要特性
- 轻量级临床推理核心:Medra 经过微调,支持结构化医学查询、诊断步骤、SOAP 格式和临床提问策略。
- 本地和移动友好:以 GGUF(Q4、Q8、BF16)格式提供,Medra 可通过 Ollama、LM Studio、KoboldCpp 和其他本地推理引擎在本地设备上运行,无需 API。
- 数据与对齐:在包括 PubMed 文献、推理数据集(如 R1 蒸馏)、临床笔记和模仿现实世界医生互动的提示结构等医学内容上进行训练。
- 高可解释性:设计注重透明度和反思,而非黑盒决策。Medra 在像对待合作伙伴而非先知一样进行提示时效果最佳。
- 设计用于伦理集成:明确目标是在 人机协作 的医疗环境中保持一致、谨慎且有用。
预期用途
- 医学教育和考试式推理
- 基于病例的学习模拟
- 人工智能健康助手原型设计
- 治疗或诊断背景下的对话建模
- 作为 思考伙伴,而非替代人类思考
局限性
⚠️ 重要提示
- Medra 并非持牌医疗专业人员,在没有人类监督的情况下,不应用于实际诊断、治疗规划或患者互动。
- 在极端情况下,模型可能会产生幻觉、简化问题或提供过时的医学知识。
- Medra 目前不具备长期记忆、访问现实世界临床数据的能力,也没有指导医疗护理的权限。
- 它是一个原型,是基础,而非专业知识的最终替代品。
技术细节
- 基础模型:Gemma 3
- 微调阶段:指令微调(STF);计划在即将发布的版本中进行基于人类反馈的强化学习(RLHF)
- 数据领域:医学问答、鉴别诊断格式、临床对话数据集、PubMed 衍生材料
- 支持的推理引擎:Ollama、LM Studio、KoboldCpp、兼容 GGML 的平台
- 量化格式:Q4、Q8、BF16
许可证
本项目采用 Apache 2.0 许可证。
Medra 家族
Medra 是不断发展的医学推理模型家族的一部分:
- Medra:基于 Gemma 的紧凑型模型,适用于轻量级本地推理
- MedraQ:基于 Qwen 3 的多语言自适应版本
- MedraOmni:未来基于 Qwen 2.5 Omni 的旗舰模型,支持全多模态
该系列中的每个模型都是有针对性地构建、符合伦理规范,并专注于负责任地增强医疗知识,而非取代它。
最后说明
Medra 的存在是因为医学需要能够体现 关怀,而不仅仅是计算的工具。
它虽小,但目标明确;虽具实验性,但态度严肃。它的构建只有一个目的:
让智能医疗更易获取、更透明,并更符合其服务对象的需求。
上传的微调模型
- 开发者:drwlf
- 许可证:apache - 2.0
- 微调基础模型:unsloth/gemma-3-4b-it-unsloth-bnb-4bit
这个 Gemma3 模型使用 Unsloth 和 Huggingface 的 TRL 库进行训练,速度提高了 2 倍。
