Medgemma-4b-it法语医疗助手开源模型 - 精准提供简短医学准确回复

首页

Medgemma 4b It French Medical Assistant

由 Sadou 开发

专为提供精准的法语医疗简短回复而优化的微调版本，基于google/medgemma-4b-it基础模型，能给出简洁（最多2-3句话）且医学准确的回答。

大型语言模型

PyTorch

法语开源协议:Apache-2.0 #法语医疗问答 #精准简短回复 #4B参数微调

下载量 1,741

发布时间 : 5/30/2025

模型简介

一款针对法语医疗咨询优化的语言模型，专注于提供简短、准确的医疗建议，适用于快速医疗信息查询场景。

模型特点

法语医疗专业化

专门针对法语医疗领域优化，能理解并生成专业医疗术语

简洁回复优化

训练目标为生成2-3句的简短回复，适合快速医疗咨询场景

医学准确性

基于专业医疗模型微调，确保回复的医学准确性

高效推理

支持4-bit量化，可在消费级GPU上高效运行

模型能力

法语医疗问答

症状解释

治疗建议生成

药物信息提供

使用案例

医疗咨询

症状咨询

用户输入症状描述，获取初步医疗建议

示例：输入偏头痛症状，输出包含药物建议和休息方法的简短回复

药物咨询

查询特定药物的用法用量信息

示例：输入布洛芬查询，输出标准剂量和使用注意事项

医疗信息快速查询

常见疾病处理

获取常见疾病的家庭处理方法

示例：输入感冒处理建议，输出休息和药物使用的简短指南

🚀 法国医疗助手MedGemma 4B - IT

本模型是一款专为提供精准的法语医疗简短回复而优化的微调版本。它基于 google/medgemma - 4b - it 基础模型进行微调，经过训练后，能够在保证医学准确性的同时，给出简洁（最多 2 - 3 句话）的回答。

✨ 主要特性

属性	详情
模型类型	文本生成
基础模型	google/medgemma - 4b - it
语言	法语 🇫🇷
专业化方向	精准的医疗简短回复
技术	直接微调
参数	约 40 亿

📦 安装指南

pip install transformers torch accelerate bitsandbytes

💻 使用示例

基础用法

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig

# 配置
model_id = "Sadou/medgemma-4b-it-french-medical-assistant"
device = "cuda" if torch.cuda.is_available() else "cpu"

# 加载微调模型
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    quantization_config=BitsAndBytesConfig(load_in_4bit=True),
    device_map="auto",
    torch_dtype=torch.bfloat16,
)

tokenizer = AutoTokenizer.from_pretrained(model_id)

def generate_medical_response(question, max_length=500, temperature=0.2):
    messages = [
        {
            "role": "system",
            "content": "Tu es un assistant médical expert. Réponds toujours en français de manière claire et précise."
        },
        {
            "role": "user", 
            "content": question
        }
    ]
    
    inputs = tokenizer.apply_chat_template(
        messages,
        add_generation_prompt=True,
        tokenize=True,
        return_dict=True,
        return_tensors="pt",
    ).to(model.device)
    
    input_len = inputs["input_ids"].shape[-1]
    
    with torch.inference_mode():
        outputs = model.generate(
            **inputs,
            max_new_tokens=max_length,
            do_sample=True,
            temperature=temperature,
            pad_token_id=tokenizer.eos_token_id,
           
        )
    
    response = tokenizer.decode(outputs[0][input_len:], skip_special_tokens=True)
    return response.strip()

# 使用示例
question = "Comment traiter une migraine ?"
response = generate_medical_response(question)
print(f"问题: {question}")
print(f"回答: {response}")

高级用法

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM

# 简单加载
model_id = "Sadou/medgemma-4b-it-french-medical-assistant"
model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype=torch.bfloat16)
tokenizer = AutoTokenizer.from_pretrained(model_id)

# 使用
question = "Comment traiter une migraine ?"
messages = [
    {"role": "system", "content": "Tu es un assistant médical expert."},
    {"role": "user", "content": question}
]

inputs = tokenizer.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt")
outputs = model.generate(inputs, max_new_tokens=200, temperature=0.7)
response = tokenizer.decode(outputs[0][inputs.shape[-1]:], skip_special_tokens=True)
print(response)

示例输出

输入："Comment traiter une migraine ?"（如何治疗偏头痛？）输出："Prenez un antalgique (paracétamol 1g ou ibuprofène 600mg) dès les premiers signes. Reposez-vous dans un endroit sombre et silencieux avec une compresse froide sur le front. Si migraines fréquentes (>4/mois), consultez pour un traitement préventif."（出现症状时立即服用止痛药（1 克扑热息痛或 600 毫克布洛芬）。在黑暗安静的地方休息，额头敷上冷毛巾。如果偏头痛频繁发作（每月超过 4 次），请咨询医生进行预防性治疗。）