Clinical ModernBERT
临床现代BERT是一种基于编码器的Transformer模型,专为处理生物医学和临床文本设计,支持长达8192个标记的上下文长度。
下载量 1,469
发布时间 : 3/27/2025
模型简介
该模型旨在生成语义丰富的表示,既能捕捉生物医学文献的微妙语法,也能理解临床叙述的复杂语义。适用于检索增强生成、细粒度文本分类和领域特定实体抽取等任务。
模型特点
扩展上下文长度
支持处理8,192个标记的序列,能捕获长距离依赖和完整文档上下文。
GeGLU激活函数
使用GeGLU激活函数,通过控制信息流增强非线性表示和模型稳定性。
旋转位置编码
采用RoPE编码相对位置信息,提供稳健的位置数据处理,尤其适用于扩展上下文。
闪存注意力
使用闪存注意力分块计算自注意力,将内存开销从二次降低至近线性复杂度,高效处理长序列。
模型能力
生物医学文本理解
临床叙述语义分析
长文本处理
掩码语言建模
使用案例
医疗保健
临床信息检索
用于检索与临床相关的医学文献和记录。
电子健康记录分析
分析电子健康记录中的临床叙述,提取关键信息。
临床决策支持系统
为临床决策提供基于文本的分析支持。
生物医学研究
循证医学文献检索
检索和分析生物医学文献,支持循证医学研究。
生物医学实体抽取
从生物医学文本中抽取特定实体(如药物名称、疾病代码等)。
精选推荐AI模型
Qwen2.5 VL 7B Abliterated Caption It I1 GGUF
Apache-2.0
Qwen2.5-VL-7B-Abliterated-Caption-it的量化版本,支持多语言图像描述任务。
图像生成文本
Transformers 支持多种语言

Q
mradermacher
167
1
Nunchaku Flux.1 Dev Colossus
其他
Colossus Project Flux 的 Nunchaku 量化版本,旨在根据文本提示生成高质量图像。该模型在优化推理效率的同时,将性能损失降至最低。
图像生成 英语
N
nunchaku-tech
235
3
Qwen2.5 VL 7B Abliterated Caption It GGUF
Apache-2.0
这是一个基于Qwen2.5-VL-7B模型的静态量化版本,专注于图像描述生成任务,支持多种语言。
图像生成文本
Transformers 支持多种语言

Q
mradermacher
133
1
Olmocr 7B 0725 FP8
Apache-2.0
olmOCR-7B-0725-FP8是基于Qwen2.5-VL-7B-Instruct模型,使用olmOCR-mix-0225数据集微调后量化为FP8版本的文档OCR模型。
图像生成文本
Transformers 英语

O
allenai
881
3
Lucy 128k GGUF
Apache-2.0
Lucy-128k是基于Qwen3-1.7B开发的专注于代理式网络搜索和轻量级浏览的模型,在移动设备上也能高效运行。
大型语言模型
Transformers 英语

L
Mungert
263
2