BioM-ALBERT-xxlarge-PMCオープンソース生物医学モデル - 複数の生物医学タスクの先進的成果達成を支援

ホーム

Biom ALBERT Xxlarge PMC

sultanによって開発

BERT、ALBERT、ELECTRAを基盤に構築された大規模生物医学言語モデルで、複数の生物医学タスクにおいて最先端の成果を達成

大規模言語モデル

Transformers

#生物医学事前学習 #大規模モデルのファインチューニング #TPU効率的トレーニング

ダウンロード数 189

リリース時間 : 3/2/2022

モデル概要

BioM-Transformersは生物医学分野に最適化されたTransformerモデルシリーズで、異なるアーキテクチャ選択により生物医学テキスト処理タスクで卓越した性能を発揮。PMC全文データで事前学習され、様々な生物医学NLPタスクをサポート。

モデル特徴

マルチアーキテクチャ対応

BERT、ALBERT、ELECTRAベースの異なるアーキテクチャバリアントを提供し、様々なアプリケーションシナリオに対応

効率的なTPUサポート

PyTorch XLAとJAX/Flax実装を提供し、Google ColabやKaggleの無料TPUリソースを活用したファインチューニングが可能

生物医学分野最適化

PMC全文データで追加64kステップの事前学習を実施し、生物医学テキスト特性に特化して最適化

計算効率

同等またはそれ以下の計算コストで類似モデルを上回る性能を達成

モデル能力

生物医学テキスト分類

生物医学固有表現抽出

生物医学QAシステム

生物医学関係抽出

使用事例

生物医学文献処理

ChemProt関係分類

化学-タンパク質相互作用分類タスク

マイクロ平均F1スコア80.74（5エポックのファインチューニングに43分要した）

BioASQ生物医学QA

生物医学分野の事実型質問に回答

臨床テキスト分析

臨床固有表現抽出

臨床テキストから医学的エンティティを識別

🚀 BioM-Transformers: BERT、ALBERT、ELECTRAを用いた大規模生物医学言語モデルの構築

本プロジェクトでは、異なる設計選択肢を用いた大規模トランスフォーマーモデルによる生物医学分野の適応を研究し、既存の生物医学言語モデルと比較して優れた性能を達成します。

🚀 クイックスタート

本プロジェクトでは、異なる設計選択肢を用いた大規模トランスフォーマーモデルによる生物医学分野の適応を経験的に研究しています。既存の生物医学言語モデルと比較して、同程度またはそれ以下の計算コストで、いくつかの生物医学分野のタスクで最先端の結果を達成しています。

✨ 主な機能

異なる設計選択肢を用いた大規模トランスフォーマーモデルによる生物医学分野の適応研究。
既存の生物医学言語モデルと比較して、同程度またはそれ以下の計算コストで、いくつかの生物医学分野のタスクで最先端の結果を達成。
TensorFlowとGluonNLPのチェックポイントを提供。
テキスト分類や質問応答タスクでの言語モデルの微調整の例を提供。

📚 ドキュメント

モデルの説明

このモデルは、BioM - ALBERT - xxlargeの重みを初期値として、PMCの全文記事でさらに64kステップ、バッチサイズ8192で事前学習されています。したがって、このモデルの総学習ステップ数は264k + 64k = 328kステップです。隠れ層のサイズが大きい（4096）ため、モデルは非常に大きくなっています。

リソースが限られた研究者がより大きなモデルを微調整できるように、PyTorch XLAを使用した例を作成しました。PyTorch XLA（https://github.com/pytorch/xla）は、TPUユニットでPyTorchを使用できるライブラリで、Google ColabとKaggleによって無料で提供されています。この例に従って、PyTorch/XLAを使用してくださいリンク。この例では、BioM - ALBERTxxlargeを使用してChemProtタスクで80.74のマイクロF1スコアを達成しています。5エポックの微調整には43分かかります。

TensorFlowとGluonNLPのチェックポイントについては、GitHubリポジトリhttps://github.com/salrowili/BioM-Transformersを確認してください。また、このリポジトリには、ChemProt、SQuAD、BioASQなどのテキスト分類と質問応答タスクで言語モデルを微調整する方法の例もいくつか追加しました。

Colabノートブックの例

BioM - ELECTRA - LARGEを用いたNERとChemProtタスク
BioM - ELECTRA - Largeを用いたSQuAD2.0とBioASQ7B Factoidタスク
BioM - ALBERT - xxlargeを用いたSQuAD2.0とBioASQ7B Factoidタスク
HuggingFace TransformersとPyTorchXLAを用いた無料TPUでのテキスト分類タスク
JAXを用いたBLURB結果の再現
Jax/Flaxを用いたBioM - Transformersの無料KaggleリソースでのTPUv3 - 8での微調整

📄 ライセンス

引用

@inproceedings{alrowili-shanker-2021-biom,
title = "{B}io{M}-Transformers: Building Large Biomedical Language Models with {BERT}, {ALBERT} and {ELECTRA}",
author = "Alrowili, Sultan and
Shanker, Vijay",
booktitle = "Proceedings of the 20th Workshop on Biomedical Language Processing",
month = jun,
year = "2021",
address = "Online",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/2021.bionlp-1.24",
pages = "221--227",
abstract = "The impact of design choices on the performance of biomedical language models recently has been a subject for investigation. In this paper, we empirically study biomedical domain adaptation with large transformer models using different design choices. We evaluate the performance of our pretrained models against other existing biomedical language models in the literature. Our results show that we achieve state-of-the-art results on several biomedical domain tasks despite using similar or less computational cost compared to other models in the literature. Our findings highlight the significant effect of design choices on improving the performance of biomedical language models.",
}