C

Codemorph ModernBERT

由Shuu12121開發
專為代碼搜索與代碼理解任務從頭訓練的預訓練模型,支持最大2048個token的序列長度,在Python代碼搜索任務中表現突出。
下載量 110
發布時間 : 2/19/2025

模型概述

基於ModernBERT基礎架構,用於代碼搜索、代碼理解和代碼補全任務,採用CodeSearchNet數據集訓練,深入理解代碼語法與註釋關聯。

模型特點

長序列支持
可處理長達2048個token的序列,適用於冗長代碼和複雜函數
卓越的代碼搜索性能
採用面向6種編程語言的SentencePiece分詞器,搜索精度顯著超越前代模型
專項訓練模型
基於CodeSearchNet數據集從頭訓練,深入理解代碼語法與註釋關聯

模型能力

代碼搜索
代碼理解
代碼補全
代碼語義理解

使用案例

代碼搜索
Python代碼搜索
在Python代碼庫中搜索相關函數或代碼片段
平均倒數排名(MRR)達到0.8172
代碼理解
代碼註釋生成
根據代碼片段生成對應的註釋
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase