DeepSeek-R1-Medical-CoT開源醫療推理模型 - 增強醫療問題推理能力

首頁

Deepseek R1 Medical CoT

由zijiechen156開發

基於DeepSeek-R1-Distill-Llama-8B微調的醫療思維鏈推理模型，通過QLoRA量化技術和Unsloth優化方案增強醫療推理能力。

大型語言模型

Safetensors

開源協議:MIT #醫療推理 #思維鏈優化 #QLoRA微調

下載量 49

發布時間 : 3/3/2025

模型概述

專為醫療思維鏈(CoT)推理優化的微調模型，適用於醫療問答和推理任務。

模型特點

醫療思維鏈推理優化

專門針對醫療領域的思維鏈(CoT)提示進行優化，增強複雜醫療問題的推理能力。

高效微調技術

採用QLoRA量化技術和Unsloth優化方案，在有限硬件資源下實現高效微調。

醫學術語支持

特別優化對醫學術語的理解和生成能力。

模型能力

醫療問答

思維鏈推理

醫學術語處理

使用案例

醫療諮詢

症狀分析

分析患者描述的早期症狀並提供可能的疾病推斷

治療方案建議

基於患者狀況提供初步治療建議

醫學教育

醫學術語解釋

向醫學生解釋複雜醫學術語和概念

🚀 DeepSeek-R1-Medical-CoT

本項目是對 deepseek-ai/DeepSeek-R1-Distill-Llama-8B 模型進行微調，旨在通過“思維鏈（CoT）”提示技術增強醫療推理能力。該模型使用 QLoRA 結合 Unsloth 優化進行訓練，可在有限的硬件資源上實現高效微調。

🚀 快速開始

1️⃣ 加載模型

from transformers import AutoModelForCausalLM, AutoTokenizer

repo_name = "your-huggingface-username/DeepSeek-R1-Medical-CoT"

tokenizer = AutoTokenizer.from_pretrained(repo_name)
model = AutoModelForCausalLM.from_pretrained(repo_name)

model.eval()

2️⃣ 運行推理

prompt = "What are the early symptoms of diabetes?"
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)

with torch.no_grad():
    output = model.generate(**inputs, max_new_tokens=200)

response = tokenizer.decode(output[0], skip_special_tokens=True)
print("Model Response:", response)

✨ 主要特性

基於 deepseek-ai/DeepSeek-R1-Distill-Llama-8B 進行微調，專注於醫療推理。
使用 Chain-of-Thought (CoT) 提示技術，增強醫療推理能力。
採用 QLoRA 結合 Unsloth 優化，可在有限硬件資源上高效微調。

📦 安裝指南

文檔未提及安裝步驟，暫不提供。

💻 使用示例

基礎用法

from transformers import AutoModelForCausalLM, AutoTokenizer

repo_name = "your-huggingface-username/DeepSeek-R1-Medical-CoT"

tokenizer = AutoTokenizer.from_pretrained(repo_name)
model = AutoModelForCausalLM.from_pretrained(repo_name)

model.eval()

高級用法

prompt = "What are the early symptoms of diabetes?"
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)

with torch.no_grad():
    output = model.generate(**inputs, max_new_tokens=200)

response = tokenizer.decode(output[0], skip_special_tokens=True)
print("Model Response:", response)

📚 詳細文檔

模型詳情

屬性	詳情
開發者	[Your Name or Organization]
微調基礎模型	`deepseek-ai/DeepSeek-R1-Distill-Llama-8B`
語言	英語，專注於醫學術語
訓練數據	醫學推理數據集 (`medical-o1-reasoning-SFT`)
微調方法	QLoRA（4 位適配器），後合併為 16 位權重
優化方式	Unsloth（微調速度提高 2 倍，內存使用更低）