C

Codesearch ModernBERT Crow Plus

Developed by Shuu12121
基於ModernBERT架構優化的多語言代碼搜索模型,支持自然語言與代碼間的語義匹配
Downloads 96
Release Time : 4/25/2025

Model Overview

該模型是針對多語言代碼搜索任務優化的句子轉換器模型,能夠高效捕捉自然語言查詢與多種編程語言代碼片段之間的語義相似性

Model Features

多語言代碼支持
支持Python、Java、JavaScript、PHP、Ruby、Go、Rust等多種編程語言的代碼搜索
高精度語義匹配
在MTEB代碼搜索任務中取得nDCG@10 0.893的優異成績,排名前8/146
函數級代碼理解
專門針對函數級代碼片段優化,能精準匹配語義相似的代碼實現
日語查詢支持
通過集成Qwen3-8B-FP8翻譯模型,支持日語自然語言查詢轉換為英語搜索

Model Capabilities

自然語言到代碼搜索
代碼到代碼相似性比較
多語言代碼特徵提取
函數級代碼語義分析

Use Cases

代碼搜索系統
GitHub倉庫函數級搜索
構建針對GitHub倉庫的函數級代碼搜索系統,支持自然語言查詢
首次創建索引後可快速複用,支持高精度語義搜索
開發輔助工具
代碼推薦
根據開發者的自然語言描述推薦相似代碼實現
代碼複用檢測
識別項目中語義相似但實現不同的代碼片段
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase