🚀 Libraモデルカード
Libraは、放射線学的レポート生成に特化した多モーダル大規模言語モデルで、特に胸部X線写真の解釈に優れています。時間的な比較を含む詳細な「検査結果」部分を生成し、医学的診断に強力な支援を提供します。
🚀 クイックスタート
このセクションのドキュメントに関連内容が提供されていないため、表示しません。
✨ 主な機能
Libra は、放射線学的レポート生成(特に 胸部X線写真の解釈)に特化した多モーダル大規模言語モデル(LLM)です。時間的な比較(例えば、現在の胸部X線写真と以前のものを比較)を含む詳細な 検査結果 部分を生成することができます。Libraは以下の主要なコンポーネントを統合しています:
- RAD - DINO:医学画像データセットで事前学習された視覚エンコーダで、胸部X線写真から強力な特徴を抽出します。
- Meditron - 7B:Llama - 2をベースとした70億パラメータの大規模言語モデルで、医学テキスト生成に特化しています。
- 時間的アライメントコネクタ(TAC):複数の時間点の特徴を融合し、時間的な比較を実現するためのカスタムアダプターです。
📚 ドキュメント
概要
このモデルカードは、Libraのアーキテクチャ、学習方法、限界、および推奨使用ガイドラインの概要を提供しています。
論文とリソース
Libraの方法、理論的基礎、および性能基準に関する詳細情報が必要な場合は、以下のリソースを参照してください:
- プロジェクトウェブサイト:[Libra v1.0](https://x - izhang.github.io/Libra_v1.0/)
- 論文:arXiv:2411.19378
- コードリポジトリ:[X - iZhang/Libra (GitHub)](https://github.com/X - iZhang/Libra)
また、私たちのSpacesデモもご覧ください! [](https://huggingface.co/spaces/X - iZhang/Libra)
学習戦略
Libraは 2段階の学習過程 を採用しています:
- 時間的特徴のアライメント
- TACを学習させ、異なる時間点(現在と以前の胸部X線写真)の特徴を効果的に融合およびアライメントさせます。
- 顕著な変化(例えば、不透明度、デバイス、および線の出現または進行)を重点的に捕捉します。
- 放射線学的レポート生成の微調整
- 大量のペアリングされた胸部X線写真画像と放射線学的レポートのデータセットで、言語モデル部分を微調整します。
- 特に時間的な記述子を組み込んだ 検査結果 部分の生成に重点を置きます。
想定される用途
Libraは主に、臨床医、研究者、および医学生が胸部X線写真レポートを生成するのを 支援 することを目的としています。主な用途は以下の通りです:
- 臨床決定支援:放射線科医が完善することができる初期の検査結果を提供します。
- 教育ツール:放射線科研修医のトレーニングに、例示的な解釈と時間的な変化を示します。
- 研究:医学画像における自動レポート生成と時間的特徴学習の研究を促進します。
⚠️ 重要な注意事項
最終的な臨床決定を下す前に、出力結果は適格な放射線科医または医療専門家によって審査されるべきです。
限界と提案
- データバイアス:モデルは、代表されていない人群またはまれな病症に対する性能が信頼できない場合があります。
- 臨床的監督:常に医療専門家による結果の検証が必要です —— Libraは専門的な判断を代替することはできません。
- 時間的な正確性:TACは時間的なアライメントに重点を置いていますが、微細またはまれな変化が識別されない場合があります。
- 汎化能力:Libraは、学習中に見たことのない胸部X線写真のタイプまたは病症に対する性能が限られている場合があります。
倫理的な考慮事項
- 患者のプライバシー:データが完全に匿名化され、HIPAA/GDPR(または関連するプライバシー規制)に準拠していることを確認してください。
- 責任ある使用:Libraの出力を慎重に使用してください;誤りがないことは保証されていません。
- 責任:ユーザーと組織は、臨床的な正確性と安全性を検証する責任を負わなければなりません。
引用方法 ✒️
学術または研究環境でLibraを使用する場合は、以下を引用してください:
@misc{zhang2025libraleveragingtemporalimages,
title={Libra: Leveraging Temporal Images for Biomedical Radiology Analysis},
author={Xi Zhang and Zaiqiao Meng and Jake Lever and Edmond S. L. Ho},
year={2025},
eprint={2411.19378},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2411.19378},
}
免責事項
このツールは研究および教育目的のみに使用されます。臨床使用のためにFDA承認またはCEマークを取得していません。ユーザーは、臨床決定を下す際には適格な医療専門家に相談する必要があります。
📄 ライセンス
このモデルはApache - 2.0ライセンスを採用しています。
属性 |
詳細 |
モデルタイプ |
多モーダル大規模言語モデル |
ベースモデル |
epfl - llm/meditron - 7b、microsoft/rad - dino |
ベースモデルの関係 |
統合 |
ライブラリ名 |
transformers |
タグ |
RRG、放射線学的レポート生成、胸部X線写真、多モーダル大規模言語モデル |
パイプラインタグ |
画像テキストからテキスト |
バージョン |
Libra - v1.0 |