Biobert-base-cased-v1.2-finetuned-ner-CRAFTオープンソースモデル - 生物医学テキストの6種類のエンティティを識別

Biobert Base Cased V1.2 Finetuned Ner CRAFT

StivenLancherosによって開発

CRAFTコーパスでファインチューニングされたBioBERTベースの固有表現認識モデル、バイオメディカルテキスト内の6種類のエンティティを識別

ダウンロード数 15

リリース時間 : 3/11/2022

モデル概要

このモデルはバイオメディカルテキスト処理に特化しており、配列、細胞、タンパク質、遺伝子、分類群、化学物質の6種類のエンティティタグを識別可能

バイオメディカル領域最適化

BioBERT事前学習モデルベースで、バイオメディカルテキストに特化して最適化

マルチカテゴリエンティティ認識

6種類の異なるバイオメディカルエンティティを同時に認識可能

高精度認識

CRAFTデータセットでF1値0.8382の認識性能を達成

バイオメディカルテキスト分析

固有表現認識

シーケンスラベリング

バイオメディカル研究

文献情報抽出

バイオメディカル文献から主要エンティティ情報を自動抽出

研究者が文献内の主要バイオメディカルエンティティを迅速に特定可能

ナレッジグラフ構築

バイオメディカルナレッジグラフのエンティティ自動注釈

ナレッジグラフ構築の効率と精度向上

学習損失	エポック	ステップ	検証損失	適合率	再現率	F1スコア	正解率
0.11	1.0	1360	0.1668	0.7952	0.7917	0.7934	0.9611
0.0484	2.0	2720	0.1640	0.8224	0.8371	0.8297	0.9661
0.0261	3.0	4080	0.1812	0.8143	0.8447	0.8292	0.9662
0.0112	4.0	5440	0.1878	0.8397	0.8366	0.8382	0.9683