🚀 Medra:您的緊湊型醫學推理夥伴
Medra是一款專門打造的輕量級醫學語言模型,旨在輔助臨床推理、醫學教育以及對話建模。它基於Gemma 3構建,是創建可部署、可解釋且符合倫理的醫學人工智能支持系統這一長期項目的第一步。該模型體積小巧,可在消費級硬件上運行;功能強大,能處理細緻的醫學提示;且堅守原則,絕不妄圖取代人類的判斷。
屬性 |
詳情 |
模型類型 |
Medra v1(Gemma版) |
模型大小 |
4b |
格式 |
GGUF(Q4、Q8、BF16) |
許可證 |
Apache 2.0 |
作者 |
Dr. Alexandru Lupoi |
基礎模型 |
unsloth/gemma-3-4b-it-qat-unsloth-bnb-4bit |
訓練數據集 |
qiaojin/PubMedQA、Mreeb/Dermatology-Question-Answer-Dataset-For-Fine-Tuning、lavita/MedQuAD |
標籤 |
text-generation、medical-ai、question-answering、summarization、dermatology、gemma-3、qlora、unsloth、fine-tuned |
任務類型 |
text-generation |

🚀 快速開始
模型概述
Medra 是專門為臨床推理、醫學教育和對話建模而設計的輕量級醫學語言模型。基於 Gemma 3 構建,它是創建可部署、可解釋且符合倫理的醫學人工智能支持系統這一長期項目的第一步。
它體積小巧,可在消費級硬件上運行;功能強大,能處理細緻的醫學提示;且堅守原則,絕不妄圖取代人類的判斷。
Medra 並非聊天機器人,而是一種 認知工具,是學生、臨床醫生和研究人員探索人工智能如何在不簡化醫療複雜性的前提下提供幫助的推理夥伴。
目的與理念
Medra 的開發旨在填補當前人工智能領域的關鍵空白:
雖然許多通用大語言模型在開放領域對話方面表現出色,但很少有模型針對 結構化的醫學相關推理 進行優化。更少的模型能夠 本地、離線且即時運行,特別是在無法訪問大型模型或這樣做不符合倫理的環境中。
Medra 旨在提供:
- 用於病例模擬和回顧的可解釋輸出
- 支持鑑別診斷探索
- 為醫學生提供反思夥伴
- 為實際臨床環境中的推理改進提供框架
該項目基於這樣一種信念:醫療領域的人工智能必須 透明、具有教育意義 且 輔助人類決策,而不是自主、掠奪性或誤導性的。
主要特性
- 輕量級臨床推理核心:Medra 經過微調,支持結構化醫學查詢、診斷步驟、SOAP 格式和臨床提問策略。
- 本地和移動友好:以 GGUF(Q4、Q8、BF16)格式提供,Medra 可通過 Ollama、LM Studio、KoboldCpp 和其他本地推理引擎在本地設備上運行,無需 API。
- 數據與對齊:在包括 PubMed 文獻、推理數據集(如 R1 蒸餾)、臨床筆記和模仿現實世界醫生互動的提示結構等醫學內容上進行訓練。
- 高可解釋性:設計注重透明度和反思,而非黑盒決策。Medra 在像對待合作伙伴而非先知一樣進行提示時效果最佳。
- 設計用於倫理集成:明確目標是在 人機協作 的醫療環境中保持一致、謹慎且有用。
預期用途
- 醫學教育和考試式推理
- 基於病例的學習模擬
- 人工智能健康助手原型設計
- 治療或診斷背景下的對話建模
- 作為 思考夥伴,而非替代人類思考
侷限性
⚠️ 重要提示
- Medra 並非持牌醫療專業人員,在沒有人類監督的情況下,不應用於實際診斷、治療規劃或患者互動。
- 在極端情況下,模型可能會產生幻覺、簡化問題或提供過時的醫學知識。
- Medra 目前不具備長期記憶、訪問現實世界臨床數據的能力,也沒有指導醫療護理的權限。
- 它是一個原型,是基礎,而非專業知識的最終替代品。
技術細節
- 基礎模型:Gemma 3
- 微調階段:指令微調(STF);計劃在即將發佈的版本中進行基於人類反饋的強化學習(RLHF)
- 數據領域:醫學問答、鑑別診斷格式、臨床對話數據集、PubMed 衍生材料
- 支持的推理引擎:Ollama、LM Studio、KoboldCpp、兼容 GGML 的平臺
- 量化格式:Q4、Q8、BF16
許可證
本項目採用 Apache 2.0 許可證。
Medra 家族
Medra 是不斷發展的醫學推理模型家族的一部分:
- Medra:基於 Gemma 的緊湊型模型,適用於輕量級本地推理
- MedraQ:基於 Qwen 3 的多語言自適應版本
- MedraOmni:未來基於 Qwen 2.5 Omni 的旗艦模型,支持全多模態
該系列中的每個模型都是有針對性地構建、符合倫理規範,並專注於負責任地增強醫療知識,而非取代它。
最後說明
Medra 的存在是因為醫學需要能夠體現 關懷,而不僅僅是計算的工具。
它雖小,但目標明確;雖具實驗性,但態度嚴肅。它的構建只有一個目的:
讓智能醫療更易獲取、更透明,並更符合其服務對象的需求。
上傳的微調模型
- 開發者:drwlf
- 許可證:apache - 2.0
- 微調基礎模型:unsloth/gemma-3-4b-it-unsloth-bnb-4bit
這個 Gemma3 模型使用 Unsloth 和 Huggingface 的 TRL 庫進行訓練,速度提高了 2 倍。
