G

Granite 3b Code Base 2k

由ibm-granite開發
Granite-3B-Code-Base-2K是IBM研究院開發的專為代碼生成任務設計的僅解碼器模型,具有3B參數規模,支持116種編程語言。
下載量 711
發布時間 : 4/23/2024

模型概述

該模型採用兩階段訓練策略,第一階段在4萬億代碼標記上訓練,第二階段在5000億高質量代碼和自然語言標記上訓練,專注於代碼生成、解釋和修復等任務。

模型特點

兩階段訓練策略
第一階段在廣泛編程語言數據上預訓練,第二階段在精選高質量數據上微調,提升推理和指令遵循能力。
激進的去重策略
採用精確和模糊去重技術,有效去除重複代碼內容,提高數據質量。
全面的安全過濾
應用HAP內容過濾、PII刪除和惡意軟件掃描,降低模型生成有害內容的風險。

模型能力

代碼生成
代碼解釋
代碼修復
生成單元測試
生成文檔
解決技術債務
漏洞檢測
代碼翻譯

使用案例

軟件開發
Python函數生成
根據自然語言描述自動生成Python函數代碼
在MBPP數據集上通過率@1達36%
代碼修復
自動修復存在錯誤的代碼片段
在HumanEval修復任務中Python修復通過率18.3%
教育
代碼解釋
為複雜代碼段生成自然語言解釋
在HumanEval解釋任務中Python解釋通過率25%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase