S

Starcoderbase

由bigcode開發
StarCoderBase是一個155億參數的大規模代碼生成模型,基於80多種編程語言訓練而成,支持代碼補全和生成任務。
下載量 3,216
發布時間 : 5/3/2023

模型概述

StarCoderBase是基於The Stack數據集中80多種編程語言訓練的大型代碼生成模型,採用多查詢注意力機制和8192標記的上下文窗口,專注於代碼生成和補全任務。

模型特點

大規模多語言支持
支持80多種編程語言的代碼生成和理解
長上下文處理
8192標記的上下文窗口,適合處理長代碼片段
中間填充能力
支持在代碼中間進行填充補全,而不僅限於從左到右生成
高效推理
採用多查詢注意力機制提升推理效率

模型能力

代碼自動補全
函數生成
代碼片段生成
多語言代碼轉換
代碼解釋

使用案例

開發輔助
代碼補全
在IDE中提供智能代碼補全建議
提高開發效率30%以上
代碼生成
根據函數簽名自動生成實現代碼
HumanEval基準pass@1達到30.4%
教育
編程學習
為學生生成示例代碼和練習
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase