B

Bioclinical ModernBERT Base

由 thomas-sounack 开发
BioClinical ModernBERT是一个基于ModernBERT构建的生物医学和临床自然语言处理模型,具有长上下文处理能力,在生物医学和临床NLP任务中表现出色。
下载量 115
发布时间 : 5/7/2025

模型简介

BioClinical ModernBERT是一个领域自适应编码器,基于ModernBERT构建,融入了长上下文处理能力,并在生物医学和临床自然语言处理的速度和性能方面有显著提升。

模型特点

长上下文处理能力
支持长达8192个标记的上下文长度,适合处理长文档。
大规模训练数据
在包含535亿个标记的生物医学和临床语料库上进行训练,覆盖多个领域和地理区域。
多源数据训练
利用来自20个不同数据集的数据,解决了依赖单一数据源的局限性。
高性能
在多个生物医学和临床NLP任务上达到state-of-the-art性能。

模型能力

生物医学文本理解
临床文本处理
掩码语言建模
文本分类
信息检索
问答系统

使用案例

临床文本分析
放射学报告分析
分析放射学报告,提取关键信息。
在肺病学相关任务中表现优异
临床笔记处理
处理临床笔记,支持下游任务如命名实体识别。
在内科医学相关任务中表现良好
生物医学研究
文献挖掘
从PubMed和PMC文献中提取生物医学知识。
在生物医学文本理解任务中表现优异
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase