R

Roberta Base Biomedical Es

PlanTL-GOB-ESによって開発
スペイン語生物医学分野向けに設計されたRoBERTaアーキテクチャの事前学習言語モデルで、臨床テキスト処理タスクに適しています。
ダウンロード数 335
リリース時間 : 3/2/2022

モデル概要

RoBERTaアーキテクチャに基づく中規模の生物医学言語モデルで、96.3億のタグ付きスペイン語生物医学コーパスで学習され、マスク言語モデリングタスクをサポートし、生物医学テキストの命名エンティティ認識とテキスト分類に特に適しています。

モデル特徴

分野特化
スペイン語生物医学分野に特化して最適化されており、臨床テキスト処理では汎用モデルよりも優れた性能を発揮します。
高品質コーパス
厳格にクリーニングされた96.3億のタグ付き生物医学コーパスを使用して学習され、複数の権威ある医学データソースが統合されています。
効率的な学習
元のRoBERTaと同じ学習パラメータを採用し、16枚のV100 GPUでわずか48時間で学習を完了できます。

モデル能力

生物医学テキストの穴埋め
臨床命名エンティティ認識
医学テキスト分類
生物医学情報抽出

使用事例

臨床文書処理
病歴自動補完
臨床記録の専門用語を自動補完します。
例では、「動脈<mask>」の補完精度が98.5%に達しました。
放射線学レポート分析
画像レポートの異常記述を識別します。
骨のX線レポートで異常記述を正確に識別しました。
医学研究
文献情報抽出
医学文献から重要な臨床情報を抽出します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase