GENIE En 8b
モデル概要
モデル特徴
モデル能力
使用事例
🚀 GENIEのモデルカード
GENIE(Generative Note Information Extraction)は、電子カルテ(EHR)の自由記述テキストを構造化するためのエンドツーエンドのモデルです。このモデルは、大規模言語モデル(LLM)の高度な分析機能を活用し、EHRの情報抽出を効率的に行います。
🚀 クイックスタート
モデルの詳細
属性 | 详情 |
---|---|
モデルサイズ | 8B (英語) |
最大トークン数 | 8192 |
ベースモデル | Llama 3.1 8B (英語) |
モデルの説明
GENIE(Generative Note Information Extraction)は、電子カルテ(EHR)からの自由記述テキストを構造化するために設計されたエンドツーエンドのモデルです。このモデルは、EHRを一度に処理し、生物医学的な固有表現とそのアサーションステータス、身体の位置、修飾語、値、単位、および意図された目的を抽出し、これらの情報を構造化されたJSON形式で出力します。この合理化されたアプローチは、従来の自然言語処理ワークフローを簡素化し、すべての分析コンポーネントを単一のモデルで置き換えることで、システムの保守を容易にし、大規模言語モデル(LLM)の高度な分析機能を活用します。汎用のLLMと比較して、GENIEはプロンプトエンジニアリングや少数例の例を必要としません。さらに、一度の処理ですべての関連属性を生成するため、実行時間と運用コストを大幅に削減します。 GENIEは、Sheng Yu(https://www.stat.tsinghua.edu.cn/teachers/shengyu/)、Tianxi Cai(https://dbmi.hms.harvard.edu/people/tianxi-cai)、およびIsaac Kohane(https://dbmi.hms.harvard.edu/people/isaac-kohane)のグループによって共同開発されました。
💻 使用例
基本的な使用法
from vllm import LLM, SamplingParams
model = LLM(model='THUMedInfo/GENIE_en_8b', tensor_parallel_size=1)
#model = LLM(model=path/to/your/local/model, tensor_parallel_size=1)
PROMPT_TEMPLATE = "Human:\n{query}\n\n Assistant:"
sampling_params = SamplingParams(temperature=temperature, max_tokens=max_new_token)
EHR = ['xxxxx1','xxxxx2']
texts = [PROMPT_TEMPLATE.format(query=k) for k in EHR]
output = model.generate(texts, sampling_params)
res = json.loads(output[0].outputs[0].text)
入力例
EHR = ["""Unit No:___
Admission Date:___
Discharge Date:___
Date of Birth:___
Sex: F
Service: MEDICINE
Allergies:
Sulfur / Norvasc
Attending:___
Addendum:
See below
Chief Complaint:
abdominal pain
Major Surgical or Invasive Procedure:
none
History of Present Illness:
84 F with PMHx of Renovascular HTN c/b NSTEMI now s/p renal
stents, Gout and h/o Crohn's disease who presented to the ED on
___with RLQ pain for approx 2 days. She denies any
nausea/vomiting/diarrhea or constipation but has not been taking
po well and felt dehydrated."""]
出力例
res = [{'phrase': 'allergies',
'semantic_type': 'Disease, Syndrome or Pathologic Function',
'assertion_status': 'title',
'body_location': 'null',
'modifier': 'null',
'value': 'not applicable',
'unit': 'not applicable',
'purpose': 'not applicable'},
{'phrase': 'sulfur',
'semantic_type': 'Chemical or Drug',
'assertion_status': 'conditional',
'body_location': 'not applicable',
'modifier': 'not applicable',
'value': 'null',
'unit': 'units: null',
'purpose': 'null'},
{'phrase': 'norvasc',
'semantic_type': 'Chemical or Drug',
'assertion_status': 'conditional',
'body_location': 'not applicable',
'modifier': 'not applicable',
'value': 'null',
'unit': 'units: null',
'purpose': 'null'},
{'phrase': 'abdominal pain',
'semantic_type': 'Sign, Symptom, or Finding',
'assertion_status': 'present',
'body_location': 'Abdominal',
'modifier': 'null',
'value': 'not applicable',
'unit': 'not applicable',
'purpose': 'not applicable'},
{'phrase': 'surgical or invasive procedure',
'semantic_type': 'Therapeutic or Preventive Procedure',
'assertion_status': 'title',
'body_location': 'null',
'modifier': 'not applicable',
'value': 'not applicable',
'unit': 'not applicable',
'purpose': 'null'},
{'phrase': 'renovascular hypertension',
'semantic_type': 'Disease, Syndrome or Pathologic Function',
'assertion_status': 'present',
'body_location': 'renal',
'modifier': 'null',
'value': 'not applicable',
'unit': 'not applicable',
'purpose': 'not applicable'},
{'phrase': 'non-st elevation myocardial infarction',
'semantic_type': 'Disease, Syndrome or Pathologic Function',
'assertion_status': 'present',
'body_location': 'null',
'modifier': 'null',
'value': 'not applicable',
'unit': 'not applicable',
'purpose': 'not applicable'},
{'phrase': 'gout',
'semantic_type': 'Disease, Syndrome or Pathologic Function',
'assertion_status': 'present',
'body_location': 'null',
'modifier': 'null',
'value': 'not applicable',
'unit': 'not applicable',
'purpose': 'not applicable'},
{'phrase': "crohn ' s disease",
'semantic_type': 'Disease, Syndrome or Pathologic Function',
'assertion_status': 'present',
'body_location': 'not applicable',
'modifier': 'not applicable',
'value': 'not applicable',
'unit': 'not applicable',
'purpose': 'not applicable'},
{'phrase': 'emergency department',
'semantic_type': 'Therapeutic or Preventive Procedure',
'assertion_status': 'present',
'body_location': 'null',
'modifier': 'not applicable',
'value': 'not applicable',
'unit': 'not applicable',
'purpose': 'null'},
{'phrase': 'pain',
'semantic_type': 'Sign, Symptom, or Finding',
'assertion_status': 'present',
'body_location': 'right lower quadrant',
'modifier': 'null',
'value': 'not applicable',
'unit': 'not applicable',
'purpose': 'not applicable'},
{'phrase': 'nausea',
'semantic_type': 'Sign, Symptom, or Finding',
'assertion_status': 'absent',
'body_location': 'null',
'modifier': 'null',
'value': 'not applicable',
'unit': 'not applicable',
'purpose': 'not applicable'},
{'phrase': 'vomiting',
'semantic_type': 'Sign, Symptom, or Finding',
'assertion_status': 'absent',
'body_location': 'null',
'modifier': 'null',
'value': 'not applicable',
'unit': 'not applicable',
'purpose': 'not applicable'},
{'phrase': 'diarrhea',
'semantic_type': 'Sign, Symptom, or Finding',
'assertion_status': 'absent',
'body_location': 'null',
'modifier': 'null',
'value': 'not applicable',
'unit': 'not applicable',
'purpose': 'not applicable'},
{'phrase': 'constipation',
'semantic_type': 'Sign, Symptom, or Finding',
'assertion_status': 'absent',
'body_location': 'null',
'modifier': 'null',
'value': 'not applicable',
'unit': 'not applicable',
'purpose': 'not applicable'}]
📄 ライセンス
このモデルはApache-2.0ライセンスの下で提供されています。
📚 引用
もしあなたがこの論文やモデルを役立つと感じた場合、以下のように引用してください。
BibTeX:
@misc{ying2025geniegenerativenoteinformation,
title={GENIE: Generative Note Information Extraction model for structuring EHR data},
author={Huaiyuan Ying and Hongyi Yuan and Jinsen Lu and Zitian Qu and Yang Zhao and Zhengyun Zhao and Isaac Kohane and Tianxi Cai and Sheng Yu},
year={2025},
eprint={2501.18435},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2501.18435},
}



