G

Gazal R1 32B GRPO Preview

由 TachyHealth 开发
Gazal-R1-32B 是一款专为医学推理和临床决策打造的语言模型,基于 Qwen 3 32B 构建,在专业医学领域展现出卓越性能。
下载量 116
发布时间 : 5/26/2025

模型简介

Gazal-R1-32B 是一款专为医学推理和临床决策打造的语言模型,能为医学研究和临床支持提供有力帮助。

模型特点

医学专业知识
在 107,033 个合成医学推理示例上进行了专业训练,涵盖诊断推理、治疗规划、不确定情况下的决策和预后评估等方面。
透明推理
按照既定的临床推理框架,在 `<think></think>` 标签中提供带有逐步解释的结构化临床思维。
卓越性能
在 MedQA 上达到 87.1%,在 MMLU Pro(医学)上达到 81.6%,在 PubMedQA 上达到 79.6%,超越了大 12 倍的模型。
参数效率
采用了包括权重分解低秩自适应(DoRA)和秩稳定 LoRA(rsLoRA)在内的先进训练技术。
对齐优化
通过具有复杂多组件奖励系统的组相对策略优化(GRPO)进行了优化。
医学知识
对多个医学专业和临床场景有全面的理解。

模型能力

医学推理
临床决策支持
诊断推理
治疗规划
预后评估
医学知识问答

使用案例

研究和教育
医学教育和培训
用于医学教育和培训,帮助医学生和医生提升临床推理能力。
临床推理研究
用于临床推理研究,帮助研究人员分析复杂的医学案例。
专业支持
文献综述辅助
辅助医学文献综述,提供结构化的医学知识总结。
临床病例分析支持
支持临床病例分析,提供详细的诊断和治疗建议。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase