BioM - ELECTRA - Large - SQuAD2 - BioASQ8Bオープンソースモデル - 生物医学分野に高精度な質問応答サポートを提供

ホーム

Biom ELECTRA Large SQuAD2 BioASQ8B

sultanによって開発

ELECTRAアーキテクチャを最適化した生物医学分野のQAモデル。BioASQ8Bデータセットでファインチューニング後、SOTA性能を達成

大規模言語モデル

Transformers

#生物医学QA #ELECTRA最適化 #SQuAD2.0転移学習

ダウンロード数 50

リリース時間 : 3/2/2022

モデル概要

生物医学分野専用に設計された質問応答モデル。PubMed抄録から直接回答を抽出可能で、パンデミックQAシステム構築などの応用シーンに適応

モデル特徴

ドメイン適応最適化

BioASQ8Bデータセットによる二次ファインチューニングで、生物医学分野のQA精度を大幅向上

計算効率の優位性

同等または低い計算コストで、オリジナルELECTRA大型版を性能で凌駕

即時利用可能なインターフェース

PubMed抄録を直接入力してQA推論可能。追加のファインチューニング不要

モデル能力

生物医学文献QA

事実型質問回答

COVID-19関連相談

専門用語理解

使用事例

医療情報システム

パンデミックQAシステム

COVID-19などの感染症関連知識の自動QAサービス構築

最新研究文献に基づく疫学問題に正確回答可能

学術研究支援

文献高速検索

大量の生物医学文献から迅速にキー情報を特定

BioASQ8Bテストセットで74.31%の正確一致率を達成

🚀 BioM-Transformers: BERT、ALBERT、ELECTRAを用いた大規模生物医学言語モデルの構築

本プロジェクトでは、BERT、ALBERT、ELECTRAを用いて大規模生物医学言語モデルを構築し、設計選択が生物医学言語モデルの性能に与える影響を研究しています。

🚀 クイックスタート

本プロジェクトでは、様々な設計選択を用いて大規模トランスフォーマーモデルによる生物医学ドメイン適応を実証的に研究しています。事前学習済みモデルの性能を、文献上の他の既存の生物医学言語モデルと比較評価しています。

✨ 主な機能

本モデルは、SQuAD2.0データセットでファインチューニングされ、その後BioASQ8B-Factoidトレーニングデータセットでもファインチューニングされています。BioASQ8B-FactoidトレーニングデータセットをSQuAD1.1形式に変換し、このデータセットでモデル（BioM-ELECTRA-Base-SQuAD2）をトレーニングおよび評価しています。
このモデルは、ファインチューニングせずに直接予測（推論）を行うことができます。このモデルカードのコンテキストボックスにPubMedのアブストラクトを入力し、与えられたコンテキスト内でいくつかの生物医学的な質問を試してみると、元のELECTRAモデルと比較してどのように機能するかを確認できます。このモデルは、パンデミック用のQAシステム（例：COVID-19）の作成にも役立つはずです。
このバージョン（PyTorch）は、BioASQ9Bへの参加で使用したもの（Layer-Wise Decayを用いたTensorFlow）とは異なります。BioASQ8Bテストデータセットの5つのバッチをすべて1つのdev.jsonファイルとして結合しています。

📦 インストール

以下のコマンドを使用してモデルをトレーニングできます。

python3 run_squad.py --model_type electra --model_name_or_path sultan/BioM-ELECTRA-Large-SQuAD2 \
--train_file BioASQ8B/train.json \
--predict_file BioASQ8B/dev.json \
--do_lower_case \
--do_train \
--do_eval \
--threads 20 \
--version_2_with_negative \
--num_train_epochs 3 \
--learning_rate 5e-5 \
--max_seq_length 512 \
--doc_stride 128 \
--per_gpu_train_batch_size 8 \
--gradient_accumulation_steps 2  \
--per_gpu_eval_batch_size 128   \
--logging_steps 50 \
--save_steps 5000 \
--fp16 \
--fp16_opt_level O1 \
--overwrite_output_dir \
--output_dir BioM-ELECTRA-Large-SQuAD-BioASQ \
--overwrite_cache

📚 ドキュメント

モデル性能の比較

以下は、私たちのモデルと元のELECTRA baseおよびlargeの非公式な比較結果です。

モデル	完全一致率 (EM)	F1スコア
ELECTRA-Base-SQuAD2-BioASQ8B	61.89	74.39
BioM-ELECTRA-Base-SQuAD2-BioASQ8B	70.31	80.90
ELECTRA-Large-SQuAD2-BioASQ8B	67.36	78.90
BioM-ELECTRA-Large-SQuAD2-BioASQ8B	74.31	84.72

📄 ライセンス

本プロジェクトでは、Tensorflow Research Cloud (TFRC) チームからの支援を受けています。

📚 引用

@inproceedings{alrowili-shanker-2021-biom,
title = "{B}io{M}-Transformers: Building Large Biomedical Language Models with {BERT}, {ALBERT} and {ELECTRA}",
author = "Alrowili, Sultan and
Shanker, Vijay",
booktitle = "Proceedings of the 20th Workshop on Biomedical Language Processing",
month = jun,
year = "2021",
address = "Online",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/2021.bionlp-1.24",
pages = "221--227",
abstract = "The impact of design choices on the performance of biomedical language models recently has been a subject for investigation. In this paper, we empirically study biomedical domain adaptation with large transformer models using different design choices. We evaluate the performance of our pretrained models against other existing biomedical language models in the literature. Our results show that we achieve state-of-the-art results on several biomedical domain tasks despite using similar or less computational cost compared to other models in the literature. Our findings highlight the significant effect of design choices on improving the performance of biomedical language models.",
}