C

Codet5p 2b

由Salesforce開發
CodeT5+是一個開源的代碼大語言模型家族,支持代碼理解與生成任務,採用編碼器-解碼器架構,可靈活切換不同工作模式。
下載量 745
發布時間 : 5/17/2023

模型概述

CodeT5+是一個新型開源代碼大語言模型家族,採用編碼器-解碼器架構,可靈活切換不同工作模式(包括純編碼器、純解碼器和編碼解碼器),支持廣泛的代碼理解與生成任務。

模型特點

靈活的工作模式
支持純編碼器、純解碼器和編碼解碼器三種工作模式,適應不同的代碼理解與生成任務。
多樣化的預訓練任務
通過片段去噪、因果語言建模、對比學習和文本-代碼匹配等多種預訓練任務,從單模態代碼數據和雙模態代碼-文本數據中學習豐富表徵。
計算高效預訓練
採用創新的計算高效預訓練方法,通過凍結現成大語言模型組件進行高效擴展,支持20億、60億、160億參數規模。
淺編碼器-深解碼器架構
採用淺編碼器-深解碼器架構,優化模型性能。

模型能力

代碼理解
代碼生成
文本-代碼檢索
行級代碼補全
檢索增強代碼生成
數學編程

使用案例

代碼生成
函數補全
根據函數簽名自動補全函數體
在HumanEval基準的零樣本文本-代碼生成任務中表現優異
代碼理解
代碼檢索
根據自然語言描述檢索相關代碼片段
在8個文本-代碼檢索任務上平均MRR提升3.2個點
數學編程
數學問題求解
將數學問題轉化為可執行代碼
在MathQA-Python和GSM8K-Python數學編程任務中表現優異
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase