DeepSeek-R1-Medical-CoT开源医疗推理模型 - 增强医疗问题推理能力

首页

Deepseek R1 Medical CoT

由 zijiechen156 开发

基于DeepSeek-R1-Distill-Llama-8B微调的医疗思维链推理模型，通过QLoRA量化技术和Unsloth优化方案增强医疗推理能力。

大型语言模型

Safetensors

开源协议:MIT #医疗推理 #思维链优化 #QLoRA微调

下载量 49

发布时间 : 3/3/2025

模型简介

专为医疗思维链(CoT)推理优化的微调模型，适用于医疗问答和推理任务。

模型特点

医疗思维链推理优化

专门针对医疗领域的思维链(CoT)提示进行优化，增强复杂医疗问题的推理能力。

高效微调技术

采用QLoRA量化技术和Unsloth优化方案，在有限硬件资源下实现高效微调。

医学术语支持

特别优化对医学术语的理解和生成能力。

模型能力

医疗问答

思维链推理

医学术语处理

使用案例

医疗咨询

症状分析

分析患者描述的早期症状并提供可能的疾病推断

治疗方案建议

基于患者状况提供初步治疗建议

医学教育

医学术语解释

向医学生解释复杂医学术语和概念

🚀 DeepSeek-R1-Medical-CoT

本项目是对 deepseek-ai/DeepSeek-R1-Distill-Llama-8B 模型进行微调，旨在通过“思维链（CoT）”提示技术增强医疗推理能力。该模型使用 QLoRA 结合 Unsloth 优化进行训练，可在有限的硬件资源上实现高效微调。

🚀 快速开始

1️⃣ 加载模型

from transformers import AutoModelForCausalLM, AutoTokenizer

repo_name = "your-huggingface-username/DeepSeek-R1-Medical-CoT"

tokenizer = AutoTokenizer.from_pretrained(repo_name)
model = AutoModelForCausalLM.from_pretrained(repo_name)

model.eval()

2️⃣ 运行推理

prompt = "What are the early symptoms of diabetes?"
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)

with torch.no_grad():
    output = model.generate(**inputs, max_new_tokens=200)

response = tokenizer.decode(output[0], skip_special_tokens=True)
print("Model Response:", response)

✨ 主要特性

基于 deepseek-ai/DeepSeek-R1-Distill-Llama-8B 进行微调，专注于医疗推理。
使用 Chain-of-Thought (CoT) 提示技术，增强医疗推理能力。
采用 QLoRA 结合 Unsloth 优化，可在有限硬件资源上高效微调。

📦 安装指南

文档未提及安装步骤，暂不提供。

💻 使用示例

基础用法

from transformers import AutoModelForCausalLM, AutoTokenizer

repo_name = "your-huggingface-username/DeepSeek-R1-Medical-CoT"

tokenizer = AutoTokenizer.from_pretrained(repo_name)
model = AutoModelForCausalLM.from_pretrained(repo_name)

model.eval()

高级用法

prompt = "What are the early symptoms of diabetes?"
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)

with torch.no_grad():
    output = model.generate(**inputs, max_new_tokens=200)

response = tokenizer.decode(output[0], skip_special_tokens=True)
print("Model Response:", response)

📚 详细文档

模型详情

属性	详情
开发者	[Your Name or Organization]
微调基础模型	`deepseek-ai/DeepSeek-R1-Distill-Llama-8B`
语言	英语，专注于医学术语
训练数据	医学推理数据集 (`medical-o1-reasoning-SFT`)
微调方法	QLoRA（4 位适配器），后合并为 16 位权重
优化方式	Unsloth（微调速度提高 2 倍，内存使用更低）