S

Starcoder

由bigcode開發
StarCoder是一個基於80多種編程語言訓練的15.5B參數代碼生成模型,支持8192個token的上下文窗口
下載量 10.72k
發布時間 : 4/24/2023

模型概述

StarCoder是一個強大的代碼生成模型,基於The Stack數據集訓練,能夠生成多種編程語言的代碼片段。它採用多查詢注意力機制和填充中間目標技術,在1萬億token上進行訓練。

模型特點

大上下文窗口
支持8192個token的上下文窗口,適合處理長代碼片段
多語言支持
基於80多種編程語言訓練,包括Python、Java、C++等主流語言
填充中間生成
支持填充中間(FIM)技術,可以補全代碼中的缺失部分
高性能
在HumanEval等基準測試中表現出色,pass@1得分達到0.408

模型能力

代碼自動補全
代碼片段生成
多語言代碼轉換
代碼文檔生成
代碼錯誤修復

使用案例

軟件開發
函數生成
根據函數簽名自動生成實現代碼
在HumanEval測試中pass@1得分0.336
代碼補全
在IDE中提供智能代碼補全建議
教育
編程學習輔助
為學生生成示例代碼或解釋編程概念
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase