SWE-Llama-13b開源模型 - 專為處理GitHub軟件工程任務量身設計

Home

SWE Llama 13b

Developed by princeton-nlp

基於CodeLlama架構微調的變體模型，專為處理GitHub問題和拉取請求中的軟件工程任務而設計。

大型語言模型

Transformers

#GitHub問題修復 #代碼補丁生成 #Python倉庫優化

Downloads 245

Release Time : 10/10/2023

Model Overview

SWE-Llama是一個專門用於生成修復補丁的模型，針對從真實GitHub問題和拉取請求中提取的軟件工程任務進行了優化。

Model Features

針對軟件工程任務優化

專門為處理GitHub問題和拉取請求中的軟件工程任務而設計。

基於CodeLlama架構

繼承了CodeLlama的強大代碼理解和生成能力。

LoRA微調方法

僅使用LoRA方法微調注意力矩陣，提高訓練效率。

Model Capabilities

代碼補丁生成

軟件問題修復

代碼理解與分析

Use Cases

開源軟件維護

自動修復GitHub問題

根據GitHub問題描述自動生成修復代碼補丁。

在SWE-bench基準測試中達到3-4%的問題解決率

代碼審查輔助

拉取請求審查

幫助開發者快速識別和修復拉取請求中的問題。

屬性	詳情
模型類型	Transformer，基於 CodeLlama 架構
參數數量	SWE-Llama-7b 為 70 億，SWE-Llama-13b 為 130 億
目標	根據問題描述和代碼上下文生成補丁以解決 GitHub 問題

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

SWE Llama 13b

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 SWE-Llama

📚 詳細文檔

數據集

模型詳情

訓練數據

訓練過程

評估結果

BibTeX 引用