smallcloudai-Refact-1_6B-fim-gguf開源代碼生成模型

首頁

Smallcloudai Refact 1 6B Fim Gguf

由maddes8cht開發

Refact-1.6B是一個1.6B參數的代碼生成模型，在多語言代碼補全和對話任務中表現優異，特別適合IDE集成。

大型語言模型支持多種語言開源協議:Openrail #多語言代碼補全 #填充中間生成 #IDE智能輔助

下載量 70

發布時間 : 11/29/2023

模型概述

專注於代碼填充中間(FIM)和對話功能的語言模型，支持多種編程語言，在HumanEval等基準測試中超越同類3B參數模型。

模型特點

卓越的代碼補全能力

在HumanEval測試中pass@1達到32%，超越同類3B參數模型

填充中間(FIM)功能

專門優化了在代碼中間位置進行智能補全的能力

對話功能支持

支持編程相關的問答對話，表現優於專門優化的對話模型

多語言代碼支持

支持Python、JavaScript、Java、C++等多種編程語言

高效推理

採用多查詢注意力等優化技術，實現快速推理

模型能力

代碼自動補全

編程問答

多語言代碼生成

代碼填充中間補全

技術文檔理解

使用案例

開發工具集成

IDE智能補全

集成到開發環境中提供即時代碼建議

顯著提升開發效率，減少編碼錯誤

編程教育

編程學習助手

解答編程問題並給出示例代碼

幫助學習者理解編程概念和實踐

代碼生成

函數級代碼生成

根據函數簽名和註釋生成實現代碼

HumanEval pass@1達到32%

🚀 Refact-1.6B-fim - GGUF

Refact-1.6B-fim - GGUF是一款代碼生成模型，在代碼補全和聊天交互方面表現出色。它在多個代碼評估指標上超越了同類型模型，且支持多語言，可在IDE中為開發者提供高效的代碼補全服務。

🚀 快速開始

你可以通過下載Refact插件立即開始使用該模型，也可以使用開源Docker容器自行託管模型。

代碼補全示例

# pip install -q transformers
from transformers import AutoModelForCausalLM, AutoTokenizer

checkpoint = "smallcloudai/Refact-1_6B-fim"
device = "cuda" # for GPU usage or "cpu" for CPU usage

tokenizer = AutoTokenizer.from_pretrained(checkpoint)
model = AutoModelForCausalLM.from_pretrained(checkpoint, trust_remote_code=True).to(device)

prompt = '<fim_prefix>def print_hello_world():\n    """<fim_suffix>\n    print("Hello world!")<fim_middle>'

inputs = tokenizer.encode(prompt, return_tensors="pt").to(device)
outputs = model.generate(inputs, max_length=100, temperature=0.2)
print("-"*80)
print(tokenizer.decode(outputs[0]))

聊天交互示例

prompt_template = "<empty_output>SYSTEM {system}\n" \
                  "<empty_output>USER {query}\n" \
                  "<empty_output>ASSISTANT"
prompt = prompt_template.format(system="You are a programming assistant",
                                query="How do I sort a list in Python?")

✨ 主要特性

高性能：經過在生成數據上的微調，該模型在HumanEval等指標上超越了Replit 3b、Stability Code 3b等模型，幾乎超越了比它大十倍的StarCoder模型。
多語言支持：支持多種編程語言，可在不同的編程場景中使用。
聊天功能：除了代碼補全，該模型還能作為聊天機器人，在聊天交互中表現良好。

📦 安裝指南

暫未提供相關安裝步驟。

💻 使用示例

基礎用法

# pip install -q transformers
from transformers import AutoModelForCausalLM, AutoTokenizer

checkpoint = "smallcloudai/Refact-1_6B-fim"
device = "cuda" # for GPU usage or "cpu" for CPU usage

tokenizer = AutoTokenizer.from_pretrained(checkpoint)
model = AutoModelForCausalLM.from_pretrained(checkpoint, trust_remote_code=True).to(device)

prompt = '<fim_prefix>def print_hello_world():\n    """<fim_suffix>\n    print("Hello world!")<fim_middle>'

inputs = tokenizer.encode(prompt, return_tensors="pt").to(device)
outputs = model.generate(inputs, max_length=100, temperature=0.2)
print("-"*80)
print(tokenizer.decode(outputs[0]))

高級用法

prompt_template = "<empty_output>SYSTEM {system}\n" \
                  "<empty_output>USER {query}\n" \
                  "<empty_output>ASSISTANT"
prompt = prompt_template.format(system="You are a programming assistant",
                                query="How do I sort a list in Python?")

📚 詳細文檔

模型信息

屬性	詳情
模型類型	Refact-1.6B-fim
訓練數據	書籍、arxiv論文、C4數據集、falcon-refinedweb、維基百科、GitHub問題、Stack Markdown、寬鬆許可的GitHub代碼自制數據集、bigcode/the-stack-dedup、rombodawg/2XUNCENSORED_MegaCodeTraining188k、bigcode/commitpackft
評估指標	code_eval
庫名稱	transformers

模型性能

任務	數據集	指標	值
文本生成	openai_humaneval (HumanEval)	pass@1 (T=0.01)	32.0
文本生成	openai_humaneval (HumanEval)	pass@1 (T=0.2)	31.5
文本生成	openai_humaneval (HumanEval)	pass@10 (T=0.8)	53.0
文本生成	openai_humaneval (HumanEval)	pass@100 (T=0.8)	76.9
文本生成	bigcode/humanevalpack (HumanEvalSynthesize Python)	pass@1 (T=0.2)	35.8
文本生成	bigcode/humanevalpack (HumanEvalSynthesize JavaScript)	pass@1 (T=0.2)	31.6
...	...	...	...