C

Codebert Base Cd Ft

由mchochlov開發
這是一個基於sentence-transformers的模型,專門針對代碼克隆檢測任務進行了微調,能將代碼片段映射到768維向量空間。
下載量 5,080
發布時間 : 8/16/2022

模型概述

該模型基於CodeBERT架構,通過對比學習方法在BigCloneBench數據集上進行微調,主要用於代碼相似度計算和克隆檢測任務。

模型特點

代碼專用嵌入
專門針對代碼片段優化的向量表示,能更好捕捉代碼語義特徵
克隆檢測優化
通過對比學習在BigCloneBench數據集上微調,特別適合代碼克隆檢測場景
高維語義表示
生成768維的密集向量,能有效表示代碼的深層語義特徵

模型能力

代碼相似度計算
代碼克隆檢測
代碼特徵提取

使用案例

代碼分析
代碼克隆檢測
識別不同代碼片段之間的相似性,發現潛在的代碼克隆
可有效檢測Type-1到Type-4級別的代碼克隆
代碼搜索
通過語義相似度實現更精準的代碼搜索
代碼質量
重複代碼識別
在大型代碼庫中識別重複或高度相似的代碼片段
幫助減少代碼冗餘,提高維護性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase