B

Bsc Bio Es

PlanTL-GOB-ESによって開発
スペイン語の生物医学分野向けに設計された事前学習済み言語モデルで、臨床NLPタスクに適しています
ダウンロード数 162
リリース時間 : 4/8/2022

モデル概要

RoBERTaアーキテクチャに基づく生物医学分野専用モデルで、9.63億トークンのスペイン語生物医学コーパスでトレーニングされ、マスク言語モデリングタスクをサポートし、特に臨床テキスト処理に適しています

モデル特徴

分野特化
スペイン語の生物医学テキストに特化してトレーニングされており、臨床症例や医学文献などの専門コーパスを含みます
高性能
PharmaCoNERなどの3つの臨床NERタスクで、汎用モデルや多言語モデルを上回る性能を発揮
大規模トレーニングデータ
9.63億トークンのクリーニング済み生物医学コーパスを使用してトレーニングされており、医療クローラーデータ、臨床症例、特許データなど多様なソースからのデータを含みます

モデル能力

生物医学テキスト理解
臨床エンティティ認識
医学テキスト分類
医学テキスト穴埋め補完

使用事例

臨床情報抽出
薬物名認識
臨床テキストから化学物質と薬物の言及を識別
PharmaCoNERタスクで0.8907 F1スコアを達成
腫瘍用語認識
スペイン語の腫瘍形態学用語を識別
CANTEMISTタスクで0.8220 F1スコアを達成
臨床文書分析
退院報告書分析
脳卒中患者の退院報告書中の臨床変数を処理
ICTUSnetデータセットで0.8727 F1スコアを達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase