C

Codegen 6B Mono

由Salesforce開發
CodeGen是用於程序合成的自迴歸語言模型系列,CodeGen-Mono 6B是基於Python編程語言數據集進一步預訓練的6B參數模型。
下載量 600
發布時間 : 4/13/2022

模型概述

CodeGen-Mono 6B是一個專注於程序合成的語言模型,能夠根據自然語言提示生成可執行代碼,特別適合Python編程任務。

模型特點

Python專用預訓練
在BigPython數據集(717億Python標記)上進行了專門預訓練,優化了Python代碼生成能力
自迴歸生成
採用自迴歸方式生成代碼,能夠根據部分代碼或自然語言提示補全完整程序
大規模訓練
使用Google TPU-v4-512集群進行大規模並行訓練

模型能力

Python代碼生成
代碼補全
程序合成

使用案例

軟件開發
根據註釋生成函數
根據自然語言註釋描述自動生成完整的Python函數實現
在HumanEval和MTPB等基準測試上表現良好
代碼補全
根據部分代碼片段自動補全完整實現
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase