C

Codeberta Small V1

由claudios開發
CodeBERTa是一個基於RoBERTa架構的代碼理解模型,專門針對多種編程語言訓練,能夠高效處理代碼相關任務。
下載量 16
發布時間 : 5/28/2024

模型概述

CodeBERTa是一個類似於RoBERTa的模型,基於GitHub的CodeSearchNet數據集訓練而成,專注於代碼理解和生成任務。

模型特點

高效代碼分詞
基於字節級BPE的分詞器,針對代碼語料庫優化,序列長度比自然語言分詞器縮短33%-50%
多語言支持
支持6種主流編程語言:Go、Java、JavaScript、PHP、Python和Ruby
輕量級架構
6層Transformer結構,參數規模8400萬,與DistilBERT相當

模型能力

代碼補全
代碼理解
編程語言識別
代碼掩碼預測

使用案例

代碼輔助開發
PHP方法補全
自動補全PHP代碼中的方法聲明
能準確預測'function'作為最可能補全結果
Python類型提示補全
自動補全Python代碼中的類型提示
能預測'framework'等與上下文相關的合理補全
編程教育
代碼示例生成
生成特定編程語言的代碼示例
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase