CodeLLaMA-chat-13b-Chinese開源代碼輔助模型，免費解答編程問題，支持多輪對話

首頁

Codellama Chat 13b Chinese

由shareAI開發

CodeLlaMa是專為代碼輔助設計的模型，擅長處理編程類問題解答，支持中英文多輪對話。

大型語言模型

Transformers

支持多種語言開源協議:Openrail #代碼問答 #多輪對話 #編程助手

下載量 16

發布時間 : 8/25/2023

模型概述

基於CodeLlaMa優化的中文編程助手模型，專注於代碼生成、問題解答和多輪對話場景，適用於開發者輔助編程。

模型特點

編程專項優化

相比通用中文模型，更擅長處理代碼生成、調試和解釋等編程相關任務

多輪對話支持

可保持長達1000 token的對話歷史記憶，適合複雜編程問題討論

中英雙語能力

同時支持中文和英文的編程問題解答

模型能力

代碼生成

編程問題解答

代碼調試輔助

技術文檔解釋

多輪技術對話

使用案例

開發輔助

代碼片段生成

根據自然語言描述生成可運行代碼

快速實現基礎功能模塊

錯誤診斷

分析報錯信息並提供解決方案

縮短調試時間

教育

編程教學助手

解釋編程概念和算法原理

輔助學習者理解複雜概念

🚀 CodeLlaMa模型的中文化版本（支持多輪對話）

本項目是CodeLlaMa模型的中文化版本，支持多輪對話。CodeLlaMa專門用於代碼助手，與ChineseLlaMa不同，它適用於代碼類問題的回覆。

🚀 快速開始

關聯倉庫

關聯Github倉庫：CodeLLaMA-chat

推理代碼

用於多輪對話的推理代碼如下，你可以直接複製運行，默認會自動拉取該模型權重：

# from Firefly
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch


def main():
    model_name = 'shareAI/CodeLLaMA-chat-13b-Chinese'

    device = 'cuda'
    max_new_tokens = 500    # 每輪對話最多生成多少個token
    history_max_len = 1000  # 模型記憶的最大token長度
    top_p = 0.9
    temperature = 0.35
    repetition_penalty = 1.0

    model = AutoModelForCausalLM.from_pretrained(
        model_name,
        trust_remote_code=True,
        low_cpu_mem_usage=True,
        torch_dtype=torch.float16,
        device_map='auto'
    ).to(device).eval()
    tokenizer = AutoTokenizer.from_pretrained(
        model_name,
        trust_remote_code=True,
        use_fast=False
    )


    history_token_ids = torch.tensor([[]], dtype=torch.long)

    user_input = input('User：')
    while True:
        input_ids = tokenizer(user_input, return_tensors="pt", add_special_tokens=False).input_ids
        eos_token_id = torch.tensor([[tokenizer.eos_token_id]], dtype=torch.long)
        user_input_ids = torch.concat([input_ids, eos_token_id], dim=1)
        history_token_ids = torch.concat((history_token_ids, user_input_ids), dim=1)
        model_input_ids = history_token_ids[:, -history_max_len:].to(device)
        with torch.no_grad():
            outputs = model.generate(
                input_ids=model_input_ids, max_new_tokens=max_new_tokens, do_sample=True, top_p=top_p,
                temperature=temperature, repetition_penalty=repetition_penalty, eos_token_id=tokenizer.eos_token_id
            )
        model_input_ids_len = model_input_ids.size(1)
        response_ids = outputs[:, model_input_ids_len:]
        history_token_ids = torch.concat((history_token_ids, response_ids.cpu()), dim=1)
        response = tokenizer.batch_decode(response_ids)
        print("Bot：" + response[0].strip().replace(tokenizer.eos_token, ""))
        user_input = input('User：')


if __name__ == '__main__':
    main()

📄 許可證

本項目採用OpenRail許可證。

📦 相關信息

屬性	詳情
模型類型	CodeLlaMa模型的中文化版本
訓練數據	shareAI/ShareGPT-Chinese-English-90k、shareAI/CodeChat
支持語言	中文、英文
庫名稱	transformers
標籤	code、chat、codellama、copilot、codeAI
任務類型	question-answering