C

Codet5p 16b

由Salesforce開發
CodeT5+ 16B是一個開源的代碼大語言模型家族,採用編碼器-解碼器架構,支持多種模式,適用於廣泛的代碼理解與生成任務。
下載量 292
發布時間 : 5/17/2023

模型概述

CodeT5+是一個新型開源代碼大語言模型家族,採用編碼器-解碼器架構,可靈活支持多種模式(如僅編碼器、僅解碼器、編碼器-解碼器),適用於廣泛的代碼理解與生成任務。

模型特點

多樣化的預訓練任務
通過片段去噪、因果語言建模、對比學習和文本-代碼匹配等多種預訓練任務進行訓練,從單模態代碼數據和雙模態代碼-文本數據中學習豐富表徵。
高效計算預訓練方法
利用現成凍結大語言模型(如CodeGen)初始化模型組件,實現高效擴展(2B/6B/16B參數規模),並採用'淺編碼器-深解碼器'架構。
指令微調
基於Code Alpaca進行指令微調以對齊自然語言指令(參見InstructCodeT5+ 16B版本)。

模型能力

代碼理解
代碼生成
文本-代碼檢索
行級代碼補全
檢索增強代碼生成

使用案例

代碼生成
函數生成
根據自然語言描述生成代碼函數。
在HumanEval基準的零樣本文本-代碼生成任務中,InstructCodeT5+ 16B以35.0% pass@1和54.5% pass@10刷新開源模型SOTA。
代碼理解
代碼檢索
根據自然語言查詢檢索相關代碼片段。
在8個文本-代碼檢索任務上平均MRR提升3.2。
數學編程
數學問題求解
解決數學編程問題,如MathQA-Python和GSM8K-Python。
CodeT5+十億級以下參數模型顯著優於多個137B參數的大模型。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase