M

Modernbert Base Ita

由 DeepMount00 开发
ModernBERT 是一种现代化的双向仅编码器 Transformer 模型(BERT 风格),在 2 万亿英语和代码数据上进行了预训练,原生上下文长度高达 8,192 个标记。
下载量 81
发布时间 : 12/19/2024

模型简介

ModernBERT 是一种现代化的双向仅编码器 Transformer 模型,适用于处理长文档的任务,如检索、分类和大规模语料库中的语义搜索。

模型特点

旋转位置嵌入(RoPE)
支持长上下文处理。
局部-全局交替注意力
提高长输入效率。
去填充和 Flash Attention
实现高效推理。
原生支持长上下文
原生上下文长度高达 8,192 个标记。

模型能力

填充掩码
长上下文处理
语义搜索
代码检索
文本分类

使用案例

自然语言处理
文本分类
对长文档进行分类任务。
语义搜索
在大规模语料库中进行语义搜索。
代码处理
代码检索
在代码库中进行检索任务。
在 CodeSearchNet 和 StackQA 上实现了代码检索的最新最优结果。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase