C

Codet5p 220m

由Salesforce開發
CodeT5+ 是一個開源的代碼大語言模型家族,採用編碼器-解碼器架構,支持多種模式,適用於廣泛的代碼理解與生成任務。
下載量 12.98k
發布時間 : 5/13/2023

模型概述

CodeT5+ 是一個面向代碼理解與生成的開源代碼大語言模型,支持多種編程語言和任務。

模型特點

多樣化的預訓練任務
通過片段去噪、因果語言建模、對比學習和文本-代碼匹配等多種預訓練任務學習豐富表徵。
計算高效預訓練
利用現成的大型語言模型凍結初始化模型組件,高效擴展模型規模。
靈活支持多種模式
支持僅編碼器、僅解碼器和編碼器-解碼器三種模式,適用於廣泛的代碼任務。

模型能力

代碼生成
代碼理解
文本到代碼檢索
行級代碼補全
檢索增強代碼生成
數學編程

使用案例

代碼生成
函數補全
根據函數簽名自動補全函數體
在HumanEval基準測試中達到35.0%的pass@1
代碼理解
文本到代碼檢索
根據自然語言描述檢索相關代碼片段
在8個文本到代碼檢索任務中平均MRR提升+3.2
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase