I

Instructcodet5p 16b

由Salesforce開發
InstructCodeT5+ 16B是一個開源的代碼大語言模型,採用編碼器-解碼器架構,支持多種模式,適用於廣泛的代碼理解與生成任務。
下載量 314
發布時間 : 5/16/2023

模型概述

該模型通過多樣化的預訓練任務從單模態代碼數據和雙模態代碼-文本數據中學習豐富表徵,支持代碼理解和生成任務。

模型特點

多樣化的預訓練任務
包括片段去噪、因果語言建模、對比學習和文本-代碼匹配,從單模態代碼數據和雙模態代碼-文本數據中學習豐富表徵。
計算高效的預訓練方法
利用現成凍結大語言模型初始化組件,高效擴展模型規模,並採用'淺編碼器-深解碼器'架構。
指令微調
遵循Code Alpaca方法進行指令微調以對齊自然語言指令,提升模型在代碼生成任務中的表現。

模型能力

代碼理解
代碼生成
文本-代碼檢索
行級代碼補全
檢索增強生成

使用案例

代碼生成
函數生成
根據自然語言指令生成完整的函數代碼。
在HumanEval基準的零樣本文本-代碼生成任務中,以35.0% pass@1和54.5% pass@10刷新開源模型SOTA。
代碼補全
行級代碼補全
根據上下文補全不完整的代碼行。
在2個行級代碼補全任務中平均Exact Match提升2.1。
數學編程
數學問題求解
解決數學編程問題,如MathQA-Python和GSM8K-Python。
十億參數以下的CodeT5+模型顯著優於許多137B參數的大模型。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase