S

Sd Ner

Developed by EMBO
RoBERTa基礎モデルに基づき、生命科学分野の英語科学テキストで微調整された命名実体識別モデル
Downloads 14
Release Time : 3/2/2022

Model Overview

このモデルは、SourceDataアノテーションシステム内の生物実体を識別するために特別に設計されており、小分子、遺伝子産物、細胞内小器官など7種類の生物医学実体を含む

Model Features

生物医学分野専用
生命科学文献に対して最適化されており、生物医学実体を正確に識別できる
多クラス実体識別
遺伝子産物、小分子など7種類の生物医学実体を識別できる
RoBERTaに基づく最適化
RoBERTa基礎モデル上で生物医学コーパスを用いてさらに訓練されている

Model Capabilities

生物医学実体識別
科学テキスト分析
多クラス分類

Use Cases

生物医学文献分析
科研論文の実体抽出
生命科学分野の論文から重要な生物実体を抽出する
F1値が0.74(マイクロ平均)
実験データのアノテーション
実験方法、細胞タイプなどの重要な情報を自動的にアノテーションする
遺伝子産物識別のF1値が0.82
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase