gpt-neo-125M-apps開源編程模型 - 免費部署輔助解決編程任務

首頁

Gpt Neo 125M Apps

由flax-community開發

基於GPT-Neo-125M在APPS數據集上微調的編程任務解決模型

大型語言模型支持多種語言開源協議:MIT #編程問題求解 #代碼生成微調 #APPS數據集

下載量 81

發布時間 : 3/2/2022

模型概述

該模型專門用於根據文本描述和起始代碼解決編程問題，是GitHub Copilot的開源版本嘗試

模型特點

編程問題解決

專門針對APPS數據集中的編程問題訓練，能夠理解問題描述並生成解決方案

開源替代方案

作為GitHub Copilot的開源版本嘗試，提供類似的代碼生成能力

多輪訓練優化

經過5個週期的精細調優，使用AdamW優化器和學習率衰減策略

模型能力

Python代碼生成

編程問題解答

函數補全

代碼合成

使用案例

軟件開發

函數實現

根據自然語言描述生成Python函數實現

可生成基本正確的函數代碼

編程練習解答

解決APPS數據集中的編程練習題

能夠生成部分正確的解決方案

教育

編程學習輔助

幫助學生理解如何將問題描述轉化為代碼

提供代碼示例供學習參考

🚀 GPT-Neo-125M-APPS

GPT-Neo-125M-APPS是一個在APPS數據集上微調的GPT-Neo-125M模型，專門用於解決編程任務。

🚀 快速開始

⚠️ 重要提示

請參考我們新的 GitHub Wiki，其中詳細記錄了我們創建GitHub Copilot開源版本的工作。

✨ 主要特性

GPT-Neo-125M-APPS是基於GPT-Neo-125M在APPS數據集上微調得到的模型，專注於解決編程任務。

📦 安裝指南

訓練此模型的腳本可在此處找到。

使用AdamW優化器和具有800個熱身步驟的線性衰減學習率調度，對模型進行了5個epoch的訓練。要復現訓練過程，可以使用以下命令結合上述腳本：

python run_clm_apps.py \
    --output_dir $HOME/gpt-neo-125M-apps \
    --model_name_or_path EleutherAI/gpt-neo-125M \
    --dataset_name $HOME/gpt-code-clippy/data_processing/apps.py \
    --dataset_config_name formatted \
    --do_train --do_eval \
    --block_size="1024" \
    --per_device_train_batch_size="16" \
    --per_device_eval_batch_size="16" \
    --preprocessing_num_workers="16" \
    --learning_rate="8e-5" \
    --warmup_steps="800" \
    --adam_beta1="0.9" \
    --adam_beta2="0.98" \
    --weight_decay="0.1" \
    --overwrite_output_dir \
    --num_train_epochs="5" \
    --logging_steps="50" \
    --eval_steps="2000" \
    --report_to="wandb" \
    --dtype="bfloat16" \
    --save_strategy epoch \
    --gradient_accumulation_steps 2 \

💻 使用示例

基礎用法

你可以直接使用文本生成管道來使用此模型。以下示例每次運行時都會生成不同的序列：

from transformers import AutoModelForCausalLM, AutoTokenizer, FlaxAutoModelForCausalLM
model = AutoModelForCausalLM.from_pretrained("flax-community/gpt-neo-125M-apps")
tokenizer = AutoTokenizer.from_pretrained("flax-community/gpt-neo-125M-apps")

prompt = """
A function to greet user. Given a user name it should say hello
def greet(name):
ANSWER:
""" 

input_ids = tokenizer(prompt, return_tensors='pt').input_ids.to(device)
start = input_ids.size(1)
out = model.generate(input_ids, do_sample=True, max_length=50, num_beams=2, 
                     early_stopping=True, eos_token_id=tokenizer.eos_token_id, )
print(tokenizer.decode(out[0][start:]))

📚 詳細文檔

模型描述

GPT-Neo-125M-APPS是在APPS數據集上微調的GPT-Neo-125M模型，專門用於解決編程任務。

訓練數據

該模型在自動化編程進度標準（APPS）數據集上進行訓練。該數據集總共包含10,000個編碼問題，有131,836個用於檢查解決方案的測試用例和232,444個人工編寫的真實解決方案。問題可能很複雜，平均每個問題的長度為293.2個單詞。數據被均勻地分為訓練集和測試集，每個集合有5,000個問題。

訓練過程

訓練此模型的腳本可在此處找到。

使用AdamW優化器和具有800個熱身步驟的線性衰減學習率調度，對模型進行了5個epoch的訓練。要復現訓練過程，可以使用上述命令結合腳本。

預期用途和侷限性

使用方法

可以直接使用文本生成管道來使用此模型，示例見“使用示例”部分。

侷限性和偏差

過度依賴：此模型可能會生成看似合理但不一定正確的解決方案。如果不正確評估生成的代碼，可能會導致負面後果，例如引入錯誤或安全漏洞。因此，用戶必須瞭解使用此語言模型的侷限性和潛在負面後果。
經濟和勞動力市場影響：在大型代碼數據集（如本數據集）上訓練的大型語言模型能夠生成高質量的代碼，有可能自動化部分軟件開發過程，這可能會對軟件開發人員產生負面影響。不過，正如論文中所討論的，根據 O*NET OnLine 的軟件開發人員總結報告所示，開發人員不僅僅是編寫軟件。
偏差：該模型在包含特定格式提示問題的數據上進行訓練。如果提示格式與APPS數據集中使用的格式不同，模型的性能可能會變差。

GPT-CC是微調後的GPT-Neo，可能繼承了它的偏差和侷限性。詳情請參閱 GPT-Neo模型卡片。