B

Bioclinical ModernBERT Base

thomas-sounackによって開発
BioClinical ModernBERTは、ModernBERTをベースに構築された生物医学および臨床自然言語処理モデルで、長文脈処理能力を備え、生物医学および臨床NLPタスクで優れた性能を発揮します。
ダウンロード数 115
リリース時間 : 5/7/2025

モデル概要

BioClinical ModernBERTは、分野適応型エンコーダで、ModernBERTをベースに構築され、長文脈処理能力を組み込み、生物医学および臨床自然言語処理の速度と性能が大幅に向上しています。

モデル特徴

長文脈処理能力
最大8192トークンの文脈長をサポートし、長いドキュメントの処理に適しています。
大規模訓練データ
535億トークンを含む生物医学および臨床コーパスで訓練され、複数の分野と地理的地域をカバーしています。
多源データ訓練
20の異なるデータセットからのデータを利用し、単一のデータソースに依存する限界を解消しました。
高性能
複数の生物医学および臨床NLPタスクで最先端の性能を達成しています。

モデル能力

生物医学テキスト理解
臨床テキスト処理
マスク言語モデリング
テキスト分類
情報検索
質問応答システム

使用事例

臨床テキスト分析
放射線学レポート分析
放射線学レポートを分析し、重要な情報を抽出します。
肺疾患学関連タスクで優れた性能を発揮します
臨床ノート処理
臨床ノートを処理し、命名エンティティ認識などの下流タスクをサポートします。
内科医学関連タスクで良好な性能を発揮します
生物医学研究
文献マイニング
PubMedおよびPMC文献から生物医学知識を抽出します。
生物医学テキスト理解タスクで優れた性能を発揮します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase