M

Modernbert Base Ita

由DeepMount00開發
ModernBERT 是一種現代化的雙向僅編碼器 Transformer 模型(BERT 風格),在 2 萬億英語和代碼數據上進行了預訓練,原生上下文長度高達 8,192 個標記。
下載量 81
發布時間 : 12/19/2024

模型概述

ModernBERT 是一種現代化的雙向僅編碼器 Transformer 模型,適用於處理長文檔的任務,如檢索、分類和大規模語料庫中的語義搜索。

模型特點

旋轉位置嵌入(RoPE)
支持長上下文處理。
局部-全局交替注意力
提高長輸入效率。
去填充和 Flash Attention
實現高效推理。
原生支持長上下文
原生上下文長度高達 8,192 個標記。

模型能力

填充掩碼
長上下文處理
語義搜索
代碼檢索
文本分類

使用案例

自然語言處理
文本分類
對長文檔進行分類任務。
語義搜索
在大規模語料庫中進行語義搜索。
代碼處理
代碼檢索
在代碼庫中進行檢索任務。
在 CodeSearchNet 和 StackQA 上實現了代碼檢索的最新最優結果。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase