llm-compiler-13b開源代碼優化模型 - 免費用於編譯器推理任務

首頁

Llm Compiler 13b

由facebook開發

LLM Compiler是一款基於Code Llama的先進LLM，專門用於代碼優化和編譯器推理任務

大型語言模型

Transformers

開源協議:其他 #編譯器優化 #代碼大小優化 #彙編反編譯

下載量 107

發布時間 : 6/4/2024

模型概述

專注於編譯器優化的語言模型，能夠預測優化效果、自動調優代碼大小以及反彙編為中間表示

模型特點

編譯器行為模擬

20%情況下能完美模擬編譯器行為，預測優化效果

代碼大小優化

相比GPT-4 Turbo實現5.24%的代碼大小改進

反彙編能力

將彙編代碼反編譯為LLVM-IR，BLEU得分0.96遠超GPT-4 Turbo的0.43

多架構支持

支持LLVM-IR、x86_64、ARM和CUDA多種彙編語言

長上下文處理

16,000 token的上下文窗口，適合處理複雜代碼

模型能力

編譯器優化預測

代碼自動調優

彙編反編譯

LLVM-IR生成

多架構代碼分析

使用案例

編譯器開發

優化通道預測

預測LLVM優化器的最佳優化通道組合

顯著減少手動調優時間

編譯器行為模擬

模擬編譯器對不同優化通道的反應

20%情況下完美匹配真實編譯器輸出

代碼優化

代碼大小優化

自動尋找最小化代碼大小的優化方案

相比GPT-4 Turbo提升5.24%

逆向工程

反彙編

將x86_64或ARM彙編轉換為LLVM-IR

BLEU得分0.96，遠超GPT-4 Turbo

🚀 Meta大語言模型編譯器（LLM Compiler）

Meta大語言模型編譯器（LLM Compiler）是一款專為編譯器優化設計的先進大語言模型。它基於Code Llama構建，在代碼優化和編譯器推理方面表現卓越，且研究和商業使用均免費。

🚀 快速開始

若要使用此模型，請確保安裝transformers：

pip install transformers accelerate

每個模型編譯器功能的示例代碼可在 llm_compiler_demo.py 中找到。以下代碼展示了默認功能。你可能需要設置HuggingFace訪問令牌 - 請參閱 (https://huggingface.co/docs/hub/security-tokens)。

from transformers import AutoTokenizer
import transformers
import torch

model = "facebook/llm-compiler-13b"

tokenizer = AutoTokenizer.from_pretrained(model)
pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    torch_dtype=torch.float16,
    device_map="auto",
)

sequences = pipeline(
    '%3 = alloca i32, align 4',
    do_sample=True,
    top_k=10,
    temperature=0.1,
    top_p=0.95,
    num_return_sequences=1,
    eos_token_id=tokenizer.eos_token_id,
    max_length=200,
)
for seq in sequences:
    print(f"Result: {seq['generated_text']}")

✨ 主要特性

性能卓越：基於Code Llama構建，在代碼優化和編譯器推理方面性能提升顯著。
免費使用：研究和商業使用均免費。
兩種版本：
- LLM Compiler：基礎模型，在超過500B的LLVM-IR、x86_84、ARM和CUDA彙編代碼上預訓練，可預測LLVM優化效果。
- LLM Compiler FTD：進一步微調，可預測LLVM彙編代碼的最佳優化方案以減小代碼大小，並將彙編代碼反彙編為LLVM-IR。
理解能力強：對編譯器優化的理解遠超現有公開可用的大語言模型，20%的時間能完美模擬編譯器。
效果領先：LLM Compiler FTD在代碼大小優化和反彙編任務上達到了最先進的結果。與GPT-4 Turbo相比，在代碼大小優化上提升了5.24%（GPT-4 Turbo為0.03%），在反彙編上的往返BLEU分數達到0.96（GPT-4 Turbo為0.43）。

📦 安裝指南

使用此模型，需安裝transformers和accelerate庫：

pip install transformers accelerate

💻 使用示例

基礎用法

from transformers import AutoTokenizer
import transformers
import torch

model = "facebook/llm-compiler-13b"

tokenizer = AutoTokenizer.from_pretrained(model)
pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    torch_dtype=torch.float16,
    device_map="auto",
)

sequences = pipeline(
    '%3 = alloca i32, align 4',
    do_sample=True,
    top_k=10,
    temperature=0.1,
    top_p=0.95,
    num_return_sequences=1,
    eos_token_id=tokenizer.eos_token_id,
    max_length=200,
)
for seq in sequences:
    print(f"Result: {seq['generated_text']}")

📚 詳細文檔

模型工作原理

LLM Compiler是Code Llama的專業化版本，是一個使用深度學習優化代碼的前沿工具。它在大量的LLVM彙編（IR）、x86_64、ARM和CUDA彙編代碼上進行了預訓練。給定一段LLVM彙編和opt（LLVM優化器）的一系列優化傳遞，LLM Compiler可以預測代碼大小的變化以及應用這些優化後輸出代碼的樣子。它對優化編譯器的行為理解程度很高，在很多情況下可以完美複製其輸出。

除了核心功能，為了展示其解決複雜編譯器優化問題的能力，LLM Compiler針對兩個特定的下游任務進行了微調：

給定一段LLVM彙編代碼，預測opt使用的最佳優化傳遞以最小化代碼大小。
從一段x86_64或ARM彙編代碼生成LLVM IR。

模型性能

我們在保留測試集上測試了LLM Compiler模型在模擬編譯器轉換、預測最佳傳遞列表和反編譯中間表示方面的性能，並將其與Code Llama和GPT-4進行了比較。

模擬編譯器優化：LLM Compiler在20%的情況下可以逐字符匹配預期的彙編，而Code Llama由於對IR的瞭解有限，無法達到較高的值。
代碼大小優化：只有LLM Compiler FTD模型在代碼大小優化上比 -Oz 有所改進，13B參數模型在61%的情況下生成的目標文件比 -Oz 更小。
反彙編性能：LLM Compiler FTD 13B在往返彙編的準確性（往返BLEU）上最高，最常產生完美的反彙編。Code Llama Instruct和GPT-4 Turbo在生成語法正確的LLVM-IR方面存在困難。

模型發佈

Meta堅信AI模型，特別是為編碼設計的模型，採用開放策略能促進創新和安全。通過發佈LLM Compiler等模型，整個社區可以探索其潛力，發現問題並修復漏洞。模型權重可在Hugging Face上獲取。

負責任使用

開發者應使用特定於編譯器的評估基準來評估模型。由於編譯器並非無缺陷，任何建議的編譯器優化都必須經過嚴格測試。當模型反彙編彙編代碼時，應確認其準確性。

生成式AI優化的未來

LLM Compiler旨在支持編譯器研究人員和工程師。我們希望它能激發更多人利用大語言模型為研究和商業產品創建新的創新工具。

🔧 技術細節

模型信息

屬性	詳情
模型開發者	Meta
模型變體	LLM Compiler有7B和13B參數兩種模型大小，有基礎版本和針對代碼大小和反彙編進行微調的指令版本
輸入	模型僅輸入文本
示例提示	請參閱倉庫中的`llm_compiler_demo.py`以獲取不同用例的示例
輸出	模型僅生成文本
模型架構	LLM Compiler是一個使用優化變壓器架構的自迴歸語言模型
模型訓練時間	2024年1月至2024年6月
模型狀態	這是一個在離線數據集上訓練的靜態模型
許可證	可在 https://ai.meta.com/resources/models-and-libraries/llama-downloads/ 獲取自定義商業許可證
研究論文	更多信息可在論文 "Meta Large Language Model Compiler: Foundation Models of Compiler Optimization" 中找到

訓練數據

所有實驗報告和發佈的模型都使用與Code Llama相同的數據進行訓練和微調，但權重不同（詳情請參閱研究論文中的第2節和表1）。

評估結果

請參閱研究論文第3節中主要模型的評估和詳細消融實驗，以及第4節中的安全評估。

倫理考慮和侷限性

LLM Compiler及其變體是一項新技術，使用時存在風險。到目前為止進行的測試都是用英語進行的，無法涵蓋所有場景。因此，與所有大語言模型一樣，LLM Compiler的潛在輸出無法提前預測，在某些情況下，模型可能會對用戶提示產生不準確或令人反感的響應。因此，在部署LLM Compiler的任何應用程序之前，開發者應針對其特定應用進行安全測試和調整。