Biomednlp KRISSBERT PubMed UMLS EL
KRISSBERTは知識強化型自己教師あり学習に基づく生物医学エンティティリンキングモデルで、アノテーションのないテキストとドメイン知識を活用してコンテキストエンコーダーを訓練し、エンティティ名の多様なバリエーションと曖昧性の問題を効果的に解決します。
ダウンロード数 4,643
リリース時間 : 4/15/2022
モデル概要
KRISSBERTは生物医学分野に特化したエンティティリンキングモデルで、コンテキストを理解し、規範的なエンティティID(UMLSのCUIなど)に正確にリンクすることができ、従来の方法では処理できなかった未知のエンティティやコンテキスト理解の欠如の問題を解決します。
モデル特徴
知識強化型自己教師あり学習
UMLSオントロジーの生物医学エンティティ名とPubMedの抄録を利用した自己教師あり事前学習を行い、ゴールドスタンダードのエンティティ言及例や全てのエンティティの規範的な記述を必要としません。
コンテキスト理解
エンティティ言及のコンテキストを理解し、曖昧性を解消して規範的なエンティティIDに正確にリンクでき、単なる表面形式の予測にとどまりません。
高性能
7つの標準的な生物医学エンティティリンキングデータセットで最先端の性能を達成し、従来の自己教師あり手法と比較して最大20ポイントの精度向上を実現しました。
モデル能力
生物医学エンティティリンキング
コンテキスト理解
エンティティ曖昧性解消
使用事例
生物医学研究
医学文献エンティティリンキング
医学文献中のエンティティ言及をUMLSの規範的なエンティティIDにリンクします。例えば、文脈に応じて「ER」を「救急室」または「エストロゲン受容体遺伝子」にリンクします。
MedMentionsデータセットで約58.3%のTop-1精度を達成しました。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98