S

Sd Ner

EMBOによって開発
RoBERTa基礎モデルに基づき、生命科学分野の英語科学テキストで微調整された命名実体識別モデル
ダウンロード数 14
リリース時間 : 3/2/2022

モデル概要

このモデルは、SourceDataアノテーションシステム内の生物実体を識別するために特別に設計されており、小分子、遺伝子産物、細胞内小器官など7種類の生物医学実体を含む

モデル特徴

生物医学分野専用
生命科学文献に対して最適化されており、生物医学実体を正確に識別できる
多クラス実体識別
遺伝子産物、小分子など7種類の生物医学実体を識別できる
RoBERTaに基づく最適化
RoBERTa基礎モデル上で生物医学コーパスを用いてさらに訓練されている

モデル能力

生物医学実体識別
科学テキスト分析
多クラス分類

使用事例

生物医学文献分析
科研論文の実体抽出
生命科学分野の論文から重要な生物実体を抽出する
F1値が0.74(マイクロ平均)
実験データのアノテーション
実験方法、細胞タイプなどの重要な情報を自動的にアノテーションする
遺伝子産物識別のF1値が0.82
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase