C

Codesearch ModernBERT Crow Plus

由Shuu12121開發
基於ModernBERT架構優化的多語言代碼搜索模型,支持自然語言與代碼間的語義匹配
下載量 96
發布時間 : 4/25/2025

模型概述

該模型是針對多語言代碼搜索任務優化的句子轉換器模型,能夠高效捕捉自然語言查詢與多種編程語言代碼片段之間的語義相似性

模型特點

多語言代碼支持
支持Python、Java、JavaScript、PHP、Ruby、Go、Rust等多種編程語言的代碼搜索
高精度語義匹配
在MTEB代碼搜索任務中取得nDCG@10 0.893的優異成績,排名前8/146
函數級代碼理解
專門針對函數級代碼片段優化,能精準匹配語義相似的代碼實現
日語查詢支持
通過集成Qwen3-8B-FP8翻譯模型,支持日語自然語言查詢轉換為英語搜索

模型能力

自然語言到代碼搜索
代碼到代碼相似性比較
多語言代碼特徵提取
函數級代碼語義分析

使用案例

代碼搜索系統
GitHub倉庫函數級搜索
構建針對GitHub倉庫的函數級代碼搜索系統,支持自然語言查詢
首次創建索引後可快速複用,支持高精度語義搜索
開發輔助工具
代碼推薦
根據開發者的自然語言描述推薦相似代碼實現
代碼複用檢測
識別項目中語義相似但實現不同的代碼片段
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase