VeriGen開源代碼生成模型 - 免費為你生成Verilog硬件描述語言代碼

首頁

Fine Tuned Codegen 6B Verilog

由shailja開發

VeriGen是基於CodeGen-multi-16B微調的6B參數模型，專門用於生成Verilog硬件描述語言代碼。

大型語言模型

Transformers

其他開源協議:Openrail #Verilog代碼生成 #硬件描述語言 #RTL設計輔助

下載量 131

發布時間 : 9/18/2022

模型概述

該模型通過GitHub和教材中的Verilog代碼訓練，能夠生成Verilog代碼片段，主要用於硬件設計和教學輔助。

模型特點

Verilog專用生成

專門針對Verilog硬件描述語言進行優化，能夠生成符合語法的代碼片段。

教學輔助能力

通過提供部分模塊頭部，可以作為Verilog教學的有效助手。

大規模預訓練

基於720億標記進行預訓練，具有強大的代碼理解和生成能力。

模型能力

Verilog代碼生成

硬件設計輔助

教學示例生成

使用案例

硬件設計

模塊生成

根據部分模塊頭部生成完整的Verilog模塊代碼

生成可運行的Verilog代碼片段

教育

教學示例

生成特定功能的Verilog實現示例用於教學

幫助學生理解Verilog編程概念

🚀 VeriGen

VeriGen是一款基於Verilog代碼數據集訓練的模型，可用於自動生成Verilog RTL代碼，為硬件描述語言的代碼生成提供了有力支持。

🚀 快速開始

✨ 主要特性

模型概述

VeriGen模型是一個具有60億參數的微調版本模型，基於CodeGen-multi-16B在Verilog代碼數據集上進行訓練。

倉庫地址：shailja-thakur/VGen
基礎大語言模型：SalesForce/CodeGen
相關論文： Benchmarking Large Language Models for Automated Verilog RTL Code Generation
聯繫方式：contact@shailja
支持語言：Verilog（硬件描述語言）

屬性	詳情
模型類型	基於CodeGen-multi-16B微調的60億參數模型
訓練數據	Verilog代碼數據集

💻 使用示例

預期用途

該模型在來自GitHub和教科書的Verilog代碼上進行訓練，它不是一個指令模型，像“編寫一個實現2對1多路複用器的模塊”這樣的命令效果不佳。然而，在提示中添加部分模塊頭信息（如“module mux”），它就能成為一個出色的Verilog教學助手。

歡迎在社區板塊分享你的生成結果！

基礎用法

# pip install -q transformers
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
# Prompt
prompt = "//module half adder "
device='cuda'
# Load model and tokenizer
model_name = "shailja/fine-tuned-codegen-6B-Verilog"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name).to(device)

# Sample
input_ids = tokenizer(prompt, return_tensors="pt").input_ids.to(device)
sample = model.generate(input_ids, max_length=128, temperature=0.5, top_p=0.9)

print(tokenizer.decode(sample[0], truncate_before_pattern=[r"endmodule"]) + "endmodule")

歸屬與其他要求

該模型的預訓練數據集並非僅篩選了允許使用的許可證。因此，模型可能會逐字生成數據集中的源代碼。代碼的許可證可能要求歸屬聲明和/或其他特定要求，必須予以遵守。

🔧 技術細節

侷限性

該模型在開源的Verilog源代碼上進行訓練。源代碼中主要使用的自然語言是英語，不過也包含其他語言。因此，該模型能夠在一定上下文下生成Verilog代碼片段，但生成的代碼不能保證按預期工作。代碼可能效率低下、包含錯誤或漏洞。有關模型侷限性的深入討論，請參閱相關論文。

訓練詳情

模型

架構：具有多查詢注意力機制的GPT - 2模型
預訓練步驟：150k
預訓練令牌：約720億
精度：fp16

硬件

GPU：4塊Tesla A100
訓練時間：10天

📄 許可證

該模型遵循BigCode OpenRAIL - M v1許可協議。你可以在此處查看完整協議。

📚 詳細文檔

引用方式

@misc{https://doi.org/10.48550/arxiv.2212.11140,
  doi = {10.48550/ARXIV.2212.11140},
  url = {https://arxiv.org/abs/2212.11140},
  author = {Thakur, Shailja and Ahmad, Baleegh and Fan, Zhenxing and Pearce, Hammond and Tan, Benjamin and Karri, Ramesh and Dolan-Gavitt, Brendan and Garg, Siddharth},
  title = {Benchmarking Large Language Models for Automated Verilog RTL Code Generation},
  publisher = {arXiv},
  year = {2022},
  copyright = {arXiv.org perpetual, non-exclusive license}
}