O

Openbioner Base

disi-unibo-nlpによって開発
OpenBioNERは、オープンドメインの生物医学命名エンティティ認識(NER)に特化した軽量BERTモデルで、対象エンティティタイプの自然言語記述のみで未見のエンティティタイプを識別でき、再トレーニングする必要がありません。
ダウンロード数 210
リリース時間 : 4/25/2025

モデル概要

OpenBioNERは、大規模言語モデル(LLM)による自己教師付き学習で生成された合成銀標データを用いて事前学習され、ゼロショット設定ではUniNERやGPT - 4oなどの専用LLMを上回り、複数の生物医学ベンチマークテストでF1スコアが最大10%向上します。

モデル特徴

ゼロショット学習能力
対象エンティティタイプの自然言語記述のみで未見のエンティティタイプを識別でき、再トレーニングする必要がありません。
軽量設計
パラメータ数はわずか110Mで、GLiNERなどのベースラインモデルより最大4倍少なく、性能はより優れています。
高い性能
複数の生物医学ベンチマークテストでF1スコアが最大10%向上し、GPT - 4oやUniNERなどのモデルを上回ります。

モデル能力

生物医学命名エンティティ認識
ゼロショット学習
複数エンティティタイプ認識

使用事例

生物医学研究
細菌名の識別
生物医学文献から細菌名を識別します。例えば、肺炎球菌(Streptococcus pneumoniae)。
BC2GMデータセットでF1スコアが49.1%に達します。
化学物質の識別
化学文献から化学物質名を識別します。
BC4CHEMDデータセットでF1スコアが48.0%に達します。
医療情報抽出
疾病名の識別
臨床テキストから疾病名を識別します。
NCBIデータセットでF1スコアが58.5%に達します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase