C

Codesearch ModernBERT Snake

由Shuu12121開發
專為代碼搜索設計的句子轉換器模型,基於ModernBERT架構,支持8192標記長序列處理
下載量 36
發布時間 : 3/26/2025

模型概述

該模型專注於計算代碼片段與文檔之間的語義相似度,適用於代碼搜索任務。基於Shuu12121/CodeModernBERT-Snake微調而來,具有處理超長代碼序列的能力。

模型特點

超長序列處理
支持最大8192個標記的序列長度,能處理極長的代碼片段和文檔
高效代碼搜索
專為代碼搜索優化,能高效計算代碼與文檔之間的語義相似度
緊湊模型尺寸
僅7500萬參數的小型模型,性能卻與更大模型相當

模型能力

代碼語義嵌入生成
代碼-文檔相似度計算
長代碼序列處理

使用案例

代碼搜索與檢索
代碼片段搜索
根據自然語言查詢搜索相關代碼片段
在CodeSearchNet基準測試中獲得72.12分
文檔-代碼匹配
自動匹配代碼片段與其對應的文檔描述
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase