gliner-biomed-bi-base-v1.0オープンソースモデル - 生物医学分野のエンティティタイプ識別に無料で使用可能

ホーム

Gliner Biomed Bi Base V1.0

Ihorによって開発

GLiNER-BioMedはGLiNERフレームワークに基づく効率的なオープンバイオメディカル固有表現認識モデルスイートで、バイオメディカル分野向けに設計されており、さまざまなエンティティタイプを認識できます。

シーケンスラベリング

PyTorch

英語オープンソースライセンス:Apache-2.0 #バイオメディカルNER #ゼロショット学習 #マルチラベル認識

ダウンロード数 25

リリース時間 : 2/19/2025

モデル概要

このモデルは、大規模な生成型バイオメディカル言語モデルから抽出された合成アノテーションを利用し、バイオメディカルエンティティ認識タスクで最先端のゼロショットおよび少数ショット性能を実現しました。

モデル特徴

効率的なオープンバイオメディカルNER

バイオメディカル分野向けに設計されており、さまざまなエンティティタイプを認識し、効率的な固有表現認識能力を提供します。

ゼロショットおよび少数ショット性能に優れる

バイオメディカルエンティティ認識タスクで最先端のゼロショットおよび少数ショット性能を実現しました。

GLiNERフレームワークに基づく

双方向Transformerエンコーダー（BERT類似）を利用してあらゆるエンティティタイプを認識し、従来のNERモデルに実用的な代替手段を提供します。

モデル能力

固有表現認識

情報抽出

バイオメディカルテキスト分析

使用事例

医療健康

疾患診断記録分析

医療記録から疾患、薬物、検査などのエンティティを識別します。

疾患、薬物、薬物投与量などのさまざまなバイオメディカルエンティティを正確に識別します。

薬剤処方分析

処方箋から薬物名、投与量、投与頻度を抽出します。

薬物関連エンティティを効率的に識別し、薬物管理システムの自動処理をサポートします。

バイオメディカル研究

文献エンティティ抽出

バイオメディカル文献から主要なエンティティ情報を抽出します。

研究者が文献中の主要なエンティティ情報を迅速に取得することをサポートします。

🚀 GLiNER-BioMed

GLiNERは、双方向トランスフォーマーエンコーダ（BERTのような）を使用して任意のエンティティタイプを識別できる固有表現抽出（NER）モデルです。これは、事前定義されたエンティティに限定される従来のNERモデルや、柔軟性はあるものの、リソース制約のあるシナリオではコストが高く大規模な大規模言語モデル（LLM）に代わる実用的な選択肢を提供します。

GLiNER-biomedは、ジュネーブ大学のDS4DHと共同開発された、GLiNERフレームワークに基づく、効率的なオープンな生物医学NERモデルの専用セットを導入します。GLiNER-biomedは、大規模な生成型生物医学言語モデルから抽出された合成アノテーションを利用して、生物医学エンティティ認識タスクにおいて最先端のゼロショットおよびフューションショットのパフォーマンスを達成します。

🚀 クイックスタート

このセクションでは、GLiNER-biomedモデルの基本的な使い方を説明します。

✨ 主な機能

柔軟なエンティティ識別：双方向トランスフォーマーエンコーダを使用して、任意のエンティティタイプを識別できます。
ゼロショットとフューションショットのパフォーマンス：合成アノテーションを利用して、生物医学エンティティ認識タスクにおいて高いパフォーマンスを達成します。
効率性：リソース制約のあるシナリオでも実用的なモデルです。

📦 インストール

公式のGLiNERライブラリをpipでインストールします。

pip install gliner -U

💻 使用例

基本的な使用法

GLiNERライブラリをインストールした後、GLiNER-biomedモデルを簡単にロードして固有表現抽出を行うことができます。

from gliner import GLiNER

model = GLiNER.from_pretrained("Ihor/gliner-biomed-bi-base-v1.0")

text = """
The patient, a 45-year-old male, was diagnosed with type 2 diabetes mellitus and hypertension.
He was prescribed Metformin 500mg twice daily and Lisinopril 10mg once daily. 
A recent lab test showed elevated HbA1c levels at 8.2%.
"""

labels = ["Disease", "Drug", "Drug dosage", "Drug frequency", "Lab test", "Lab test value", "Demographic information"]

entities = model.predict_entities(text, labels, threshold=0.5)

for entity in entities:
    print(entity["text"], "=>", entity["label"])

期待される出力:

45-year-old male => Demographic information
type 2 diabetes mellitus => Disease
hypertension => Disease
Metformin => Drug
500mg => Drug dosage
twice daily => Drug frequency
Lisinopril => Drug
10mg => Drug dosage
once daily => Drug frequency
HbA1c levels => Lab test
8.2% => Lab test value

高度な使用法

大量のエンティティがあり、事前に埋め込みを行いたい場合は、以下のコードスニペットを参照してください。

labels = ["your entities"]
texts = ["your texts"]

entity_embeddings = model.encode_labels(labels, batch_size = 8)

outputs = model.batch_predict_with_embeds(texts, entity_embeddings, labels)

📚 ドキュメント

ベンチマーク

我々は、8つの複雑な実世界のデータセットでモデルを検証し、他のGLiNERモデルと比較しました。

モデル	F1スコア	マクロ平均F1	マクロ中央値F1	加重F1
大規模モデル
NuNER Zero	40.87	21.79	13.94	33.67
NuNER Zero span	40.26	22.51	14.27	32.52
GLiNER bio v0.1	42.34	27.10	24.44	38.32
GLiNER bio v0.2	38.66	25.36	17.02	32.42
GLiNER v1.0	47.77	29.60	21.13	40.78
GLiNER v2.0	37.38	21.42	15.44	33.11
GLiNER v2.1	48.04	29.75	28.20	43.43
GLiNER news v2.1	48.99	31.79	33.77	45.13
GLiNER v2.5	53.81	35.22	35.65	51.57
GLiNER-biomed	59.77	40.67	42.65	58.40
GLiNER-biomed-bi	54.90	35.78	31.66	50.46
ベースモデル
GLiNER v1.0	41.61	24.98	10.27	31.59
GLiNER v2.0	34.33	24.48	22.01	30.58
GLiNER v2.1	40.25	25.26	14.41	32.64
GLiNER news v2.1	41.59	27.16	17.74	34.44
GLiNER v2.5	46.49	30.93	25.26	44.68
GLiNER-biomed	54.37	36.20	41.61	53.05
GLiNER-biomed-bi	58.31	35.22	32.39	54.91
小規模モデル
GLiNER v1.0	40.99	22.81	7.86	31.15
GLiNER v2.0	33.55	21.12	15.76	28.78
GLiNER v2.1	38.45	23.25	10.92	30.67
GLiNER news v2.1	39.15	24.96	14.48	33.10
GLiNER v2.5	38.21	28.53	18.01	36.88
GLiNER-biomed	52.53	34.49	38.17	50.87
GLiNER-biomed-bi	56.93	33.88	33.61	53.12

Discordへの参加

モデルに関するニュース、サポート、および議論のために、Discordでコミュニティに参加してください。Discordに参加しましょう。

📄 ライセンス

このモデルはApache-2.0ライセンスの下で提供されています。

🔖 引用

この研究

もしあなたの研究でGLiNER-biomedモデルを使用した場合、以下を引用してください。

@misc{yazdani2025glinerbiomedsuiteefficientmodels,
      title={GLiNER-biomed: A Suite of Efficient Models for Open Biomedical Named Entity Recognition},
      author={Anthony Yazdani and Ihor Stepanov and Douglas Teodoro},
      year={2025},
      eprint={2504.00676},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2504.00676},
}

過去の研究

@misc{zaratiana2023gliner,
      title={GLiNER: Generalist Model for Named Entity Recognition using Bidirectional Transformer},
      author={Urchade Zaratiana and Nadi Tomeh and Pierre Holat and Thierry Charnois},
      year={2023},
      eprint={2311.08526},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

@misc{stepanov2024gliner,
      title={GLiNER multi-task: Generalist Lightweight Model for Various Information Extraction Tasks},
      author={Ihor Stepanov and Mykhailo Shtopko},
      year={2024},
      eprint={2406.12925},
      archivePrefix={arXiv},
      primaryClass={id='cs.LG' full_name='Machine Learning' is_active=True alt_name=None in_archive='cs' is_general=False description='Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.'}
}