genji-python-6B-split開源模型 - 免費助力Python編程代碼生成與輔助！

首頁

Genji Python 6B Split

由baffo32開發

基於GPT-J 6B微調的Python代碼生成模型，專注於Python編程輔助

大型語言模型

Transformers

英語開源協議:Apache-2.0 #Python代碼生成 #6B參數大模型 #旋轉位置編碼

下載量 16

發布時間 : 3/2/2022

模型概述

Genji-python-6B是基於GPT-J 6B模型微調而成的Transformer模型，專門針對Python代碼生成任務進行了優化訓練。該模型能夠輔助Python代碼編寫，支持代碼補全和生成功能。

模型特點

Python代碼專注

使用約4GB Python代碼數據進行微調，專門優化了Python代碼生成能力

分片檢查點

通過拆分模型檢查點，顯著降低了加載時的內存佔用並加速了加載過程

旋轉位置編碼

採用RoPE(Rotary Position Embedding)位置編碼，增強了長序列建模能力

高效推理

支持FP16精度，可在16GB顯存的顯卡上運行

模型能力

Python代碼補全

Python函數生成

代碼文檔生成

代碼結構預測

使用案例

編程輔助

函數自動補全

根據函數名開頭自動補全完整函數實現

示例中成功生成了包含文檔字符串和邏輯的完整函數

代碼重構

根據已有代碼片段生成更優化的實現

教育

編程學習輔助

幫助學習者理解Python編程模式和最佳實踐

🚀 Genji-python 6B

Genji-python 6B 是一個經過微調的變壓器模型，專門用於輔助編寫 Python 代碼。它基於 EleutherAI 的 GPT - J 6B 模型，在近 4GB 的 Python 代碼上進行訓練。通過 Colab 筆記本，你可以輕鬆使用該模型。

🚀 快速開始

若要使用該模型，你可以查看我們的 Colab 筆記本： Notebook

✨ 主要特性

基於 EleutherAI 的 GPT - J 6B 模型微調，專注於 Python 代碼。
拆分模型的檢查點，加載時使用更少系統內存，加載速度更快。

📦 安裝指南

此模型目前僅可通過我們的分叉倉庫使用，因為 GPT - J 尚未合併到主 transformers 倉庫。待合併後，我們會讓該模型更易於加載。

步驟 1：安裝分叉倉庫

使用 pip 安裝：

pip install git+https://github.com/finetuneanon/transformers@gpt-neo-localattention3-rp-b

步驟 2：安裝 git - lfs

在 Ubuntu 上：

apt install git-lfs

安裝完成後，初始化 git - lfs：

git lfs install

步驟 3：克隆倉庫

git clone https://huggingface.co/NovelAI/genji-python-6B-split

💻 使用示例

基礎用法

我們建議以 FP16 格式使用該模型，這樣它可以適配 16GB VRAM 的顯卡。

from transformers import (
    AutoTokenizer,
    AutoModelForCausalLM,
    GPTNeoForCausalLM,
)

model = AutoModelForCausalLM.from_pretrained("genji-python-6B-split/model").half().eval().cuda()
tokenizer = AutoTokenizer.from_pretrained("EleutherAI/gpt-neo-2.7B")

text = '''def print_customer_name'''

tokens = tokenizer(text, return_tensors="pt").input_ids
generated_tokens = model.generate(tokens.long().cuda(), use_cache=True, do_sample=True, top_k=50, temperature=0.3, top_p=0.9, repetition_penalty=1.125, min_length=1, max_length=len(tokens[0]) + 400, pad_token_id=tokenizer.eos_token_id)
last_tokens = generated_tokens[0][len(tokens[0]):]
generated_text = tokenizer.decode(last_tokens)
print("Generation:\n" + generated_text)

運行上述代碼會生成以下結果：

Prompt:
def print_customer_name
Generation:
(self, customer):
        """Print the name of a customer."""
        if not self.is_valid():
            return

        print("Customer: {}".format(customer))

高級用法

你也可以通過我們的 Colab 筆記本查看更多使用示例： Notebook

📚 詳細文檔

模型描述

Genji 是在 EleutherAI 的 GPT - J 6B 模型上微調的變壓器模型。此特定模型僅在大小接近 4GB 的 Python 代碼上進行訓練。拆分模型的檢查點已拆分，這使得加載時使用更少的系統 RAM，並且加載速度更快。不過，該模型的設置需要更多工作，因為你需要安裝 git - lfs 並拉取倉庫。

屬性

詳情

模型類型

基於 EleutherAI 的 GPT - J 6B 微調的變壓器模型

訓練數據

來自 Pile 的 Python 代碼

超參數

n_parameters	6,053,381,344
n_layers	28*
d_model	4,096
d_ff	16,384
n_heads	16
d_head	256
n_ctx	2,048
n_vocab	50,400（與 GPT - 2/3 使用相同的分詞器）
位置編碼	旋轉位置編碼 (RoPE)
RoPE 維度	64