🚀 Gazal-R1-32B:医学推論用言語モデル
Gazal-R1-32Bは、医学推論と臨床判断を目的として特別に開発された言語モデルです。Qwen 3 32Bをベースに構築され、特殊な訓練方法を用いることで、専門的な医学分野で卓越した性能を発揮し、医学研究や臨床支援に大きな役割を果たします。
🚀 クイックスタート
基本的な使用法
from transformers import AutoModelForCausalLM, AutoTokenizer
model_name = "TachyHealth/Gazal-R1-32B-GRPO-preview"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
model_name,
torch_dtype="auto",
device_map="auto"
)
prompt = """A 65-year-old male presents with chest pain, shortness of breath, and elevated troponin levels.
ECG shows ST-segment elevation in leads II, III, and aVF. What is the most likely diagnosis and immediate management?"""
messages = [
{"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
messages,
tokenize=False,
add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
generated_ids = model.generate(
**model_inputs,
max_new_tokens=2048,
temperature=0.7,
top_p=0.8,
top_k=20
)
output_ids = generated_ids[0][len(model_inputs.input_ids[0]):].tolist()
response = tokenizer.decode(output_ids, skip_special_tokens=True)
print("Medical Assessment:", response)
構造化された医学推論形式
Gazal-R1は、以下の形式で構造化された医学推論を提供するように訓練されています。
<think>
Step 1: Analyze presenting symptoms - chest pain, dyspnea, troponin elevation
Step 2: Interpret ECG findings - ST elevation in inferior leads
Step 3: Consider differential diagnoses - STEMI vs NSTEMI vs unstable angina
Step 4: Identify culprit vessel - likely RCA given inferior lead changes
Step 5: Assess urgency - emergent intervention required
Step 6: Plan immediate management - dual antiplatelet, anticoagulation, cath lab
</think>
## Clinical Assessment
**Primary Diagnosis**: ST-Elevation Myocardial Infarction (STEMI), inferior wall
**Reasoning**: The combination of chest pain, elevated troponin, and ST-elevation in leads II, III, and aVF is pathognomonic for inferior STEMI, likely involving the right coronary artery (RCA).
**Immediate Management**:
1. **Reperfusion therapy**: Emergency cardiac catheterization with primary PCI
2. **Antiplatelet therapy**: Aspirin 325mg + P2Y12 inhibitor (clopidogrel/ticagrelor)
3. **Anticoagulation**: Heparin or bivalirudin
4. **Supportive care**: O2 if hypoxic, nitroglycerin for pain (avoid if hypotensive)
**Follow-up**: Post-PCI monitoring, echocardiogram, cardiac rehabilitation referral
✨ 主な機能
- 医学的専門知識:診断推論、治療計画、不確実性下での意思決定、予後評価などの分野をカバーする107,033個の合成医学推論事例で専門的に訓練されています。
- 透明な推論:既定の臨床推論フレームワークに沿って、
<think></think>
タグ内に段階的な説明付きの構造化された臨床思考を提供します。
- 卓越した性能:MedQAで87.1%、MMLU Pro(医学)で81.6%、PubMedQAで79.6%のスコアを達成し、12倍も大きいモデルを上回っています。
- パラメータ効率:重み分解低ランク適応(DoRA)やランク安定LoRA(rsLoRA)などの高度な訓練技術を採用しています。
- アライメント最適化:複雑な多コンポーネント報酬システムを持つグループ相対的ポリシー最適化(GRPO)によって最適化されています。
- 医学知識:複数の医学専門分野や臨床シナリオに対する包括的な理解を持っています。
📚 ドキュメント
モデルの概要
属性 |
詳細 |
モデルタイプ |
因果言語モデル(医学推論の専門家) |
ベースモデル |
Qwen 3 32B |
訓練段階 |
二段階のプロセス(教師付き微調整 + 強化学習) |
パラメータ数 |
328億 |
パラメータ数(非埋め込み) |
312億 |
コンテキスト長 |
ネイティブで32,768トークン、YaRNを使用すると131,072トークンまで拡張可能 |
訓練データ |
107,033個の合成医学推論事例 + MedReasonデータセット(32,682個の事例) |
微調整方法 |
DoRA + rsLoRA(パラメータ効率的な微調整) |
アライメント方式 |
グループ相対的ポリシー最適化(GRPO) |
性能結果
モデル |
規模 |
MMLU Pro(医学) |
MedMCQA |
MedQA |
PubMedQA |
Gazal-R1(最終版) |
32B |
81.6 |
71.9 |
87.1 |
79.6 |
Gazal-R1(教師付き微調整のみ版) |
32B |
79.3 |
72.3 |
86.9 |
77.6 |
Llama 3.1 405B Instruct |
405B |
70.2 |
75.8 |
81.9 |
74.6 |
Qwen 2.5 72B Instruct |
72B |
72.1 |
66.2 |
72.7 |
71.7 |
Med42-Llama3.1-70B |
70B |
66.1 |
72.4 |
80.4 |
77.6 |
Llama 3.1 70B Instruct |
70B |
74.5 |
72.5 |
78.4 |
78.5 |
QwQ 32B |
32B |
70.1 |
65.6 |
72.3 |
73.7 |
Qwen 3 32B |
32B |
78.4 |
71.6 |
84.4 |
76.7 |
主な成果:
- MMLU Pro(医学)、MedQA、PubMedQAで最高スコアを達成しました。
- GRPOによる訓練で大幅な向上が見られました(MMLU Proで2.3%、PubMedQAで2.0%の向上)。
- 医学推論タスクで12倍も大きいモデル(Llama 3.1 405B)を上回っています。
訓練方法
段階1:教師付き微調整(SFT)
- データセット:107,033個の合成医学推論事例 + MedReasonデータセット
- 技術:ランク256のDoRA + rsLoRAを採用
- 重点:診断、治療、予後のシナリオにまたがる構造化された臨床推論
段階2:グループ相対的ポリシー最適化(GRPO)
- アルゴリズム:価値関数のない強化学習
- データセット:UltraMedicalサブセット(32,000個の医学多肢選択問題)
- 報酬:多コンポーネントシステム(正確性、形式、長さ制御、重複ペナルティ)
- 改善点:推論の質と形式の遵守度が向上しました。
モデルの能力
臨床推論のタイプ
- 診断推論:系統的な症状分析 - 鑑別診断
- 治療計画:患者固有の要因を考慮したエビデンスベースの治療選択
- 不確実性下での意思決定:リスク評価と臨床判断
- 予後評価:臨床エビデンスに基づく結果予測
カバーする医学専門分野
- 内科
- 救急医学
- 心臓病学
- 呼吸器病学
- 感染症学
- 薬理学
- 病理生理学
- 臨床検査医学
使用シナリオ
研究と教育
- 医学教育とトレーニング
- 臨床推論の研究
- 医学知識の評価
- 学術医学論文の執筆支援
専門的な支援(監督下で)
- 文献レビューの支援
- 臨床症例分析の支援
- 医学文書作成の支援
- 鑑別診断の探索
不適切なシナリオ
- 直接の患者ケア
- 緊急医療判断
- 臨床判断の代替
- 無監督の医学的アドバイス
モデルのアクセス
🔧 技術詳細
制限事項と重要な免責事項
重要な安全情報
⚠️ 重要な注意
- Gazal-R1は研究用モデルであり、直接の臨床使用、診断、または治療計画には使用されません。
- すべての出力は、資格のある医療専門家によって独立して検証される必要があります。
- 知識は静的であり、最新の医学研究やガイドラインを反映していません。
技術的な制限事項
⚠️ 重要な注意
- 知識の截止:訓練データは訓練日以前の医学知識を反映しています。
- 幻覚のリスク:合理的に聞こえるが事実に誤りのある情報を生成する可能性があります。
- 評価範囲:主に多肢選択問題で評価されており、実際の臨床シナリオとは異なる場合があります。
- 地域的なバイアス:訓練データに地理的または人口統計学的なバイアスが含まれている可能性があります。
倫理的な考慮事項
⚠️ 重要な注意
- 専門的な責任:最終的な医療判断は、常に資格のある医療提供者によって行われる必要があります。
- 説明責任:ユーザーは、モデルの出力を検証し、適切に適用する責任があります。
- 患者の安全:緊急医療状況や時間に敏感な判断には決して使用しないでください。
📄 ライセンス
このモデルはApache 2.0ライセンスの下で公開されています。使用前にライセンス条項を確認してください。
連絡先
Gazal-R1に関する質問がある場合は、以下の連絡先までお問い合わせください。
TachyHealthの研究チームによって開発されました。このモデルは医学人工知能推論において大きな進歩を遂げると同時に、専門的な医学的監督の重要性を強調しています。