C

Codemodernbert Owl 3.0

由Shuu12121開發
CodeModernBERT-Owl-3.0 是 CodeModernBERT 系列中多語言長上下文編碼器模型的最終預訓練版本,針對代碼搜索、代碼摘要、錯誤修復和表示學習等下游代碼相關任務進行了優化。
下載量 119
發布時間 : 6/20/2025

模型概述

該模型基於預訓練檢查點 CodeModernBERT-Owl-3.0-Pre 構建,並進一步進行了預訓練,以更好地捕捉多種編程語言源代碼中的結構模式和語義。

模型特點

長上下文窗口
支持 2048 個標記的上下文窗口,適合理解長代碼。
多語言支持
在 8 種編程語言的 1120 萬個函數上進行訓練,支持多語言代碼理解。
下游任務優化
針對代碼搜索、語義嵌入、摘要和完形填空式錯誤修復等下游任務進行了微調。
高性能
在 CodeSearchNet 測試集的所有語言中實現了最高的 MRR,展示了出色的跨語言一致性。

模型能力

代碼搜索
代碼摘要
錯誤修復
表示學習
多語言代碼理解

使用案例

代碼搜索
跨語言代碼搜索
使用模型嵌入進行跨語言的代碼搜索任務。
在 CodeSearchNet 測試集上,MRR 達到 0.8814(Python)。
代碼摘要
自動生成代碼摘要
利用模型生成代碼片段的自然語言摘要。
錯誤修復
完形填空式錯誤修復
使用模型的填充掩碼功能進行代碼錯誤修復。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase