KernelLLM-GGUF開源模型 - 免費部署，輕鬆編寫Triton的GPU內核

首頁

Kernelllm GGUF

由lmstudio-community開發

KernelLLM是基於Llama 3.1 Instruct微調的模型，專門用於編寫使用Triton的GPU內核。

大型語言模型開源協議:其他 #Triton內核生成 #128k長上下文 #Llama3.1微調

下載量 214

發布時間 : 5/19/2025

模型概述

該模型能夠將PyTorch模塊轉換為Triton內核，並在KernelBench-Triton數據集上進行了評估，表現出競爭性或更優的性能。

模型特點

128k tokens上下文長度

支持超長上下文，適合處理複雜的內核生成任務

GPU內核代碼生成

專門優化用於將PyTorch模塊轉換為高效的Triton GPU內核

高效性能

相比更大的模型，在內核生成任務上表現出競爭性或更優的性能

模型能力

文本生成

代碼生成

GPU內核優化

使用案例

GPU編程

PyTorch到Triton轉換

將PyTorch模塊自動轉換為高效的Triton GPU內核

生成的內核在性能上可與手工優化代碼媲美

高性能計算

為科學計算和機器學習任務生成優化的GPU內核

提升計算密集型任務的執行效率

🚀 社區模型：Facebook的KernelLLM

這是 LM Studio 社區模型亮點計劃。該計劃旨在突出社區中新穎且值得關注的模型。快來 Discord 參與討論吧！

模型信息

屬性	詳情
模型創建者	facebook
原始模型	KernelLLM
GGUF量化	由 bartowski 基於 `llama.cpp` 版本 b5415 提供
量化者	bartowski
任務類型	文本生成
基礎模型	facebook/KernelLLM
數據集	ScalingIntelligence/KernelBench
許可證	other
基礎模型關係	量化版本

🔧 技術細節

支持128k個標記的上下文長度。
基於Llama 3.1 Instruct進行微調，專門用於使用Triton編寫GPU內核的任務。
KernelLLM可以將PyTorch模塊轉換為Triton內核，並在KernelBench-Triton上進行了評估。
在核生成任務中，與更大的模型相比，它能取得有競爭力或更優的性能。

🙏 特別感謝

特別感謝 Georgi Gerganov 以及整個 llama.cpp 團隊，是他們讓這一切成為可能。

⚠️ 免責聲明

LM Studio並非社區模型計劃中任何模型的創建者、發起者或所有者。每個社區模型均由第三方創建和提供。LM Studio不認可、支持、代表或保證任何社區模型的完整性、真實性、準確性或可靠性。您應明白，社區模型可能會生成具有冒犯性、有害性、不準確或其他不當或欺騙性的內容。每個社區模型的唯一責任在於發起該模型的個人或實體。LM Studio可能不會監控或控制社區模型，也不能且不會對任何此類模型負責。LM Studio聲明不承擔關於社區模型的準確性、可靠性或益處的所有保證或擔保。此外，LM Studio聲明不保證社區模型能滿足您的需求，不保證其安全性、連續性、隨時可用性或無錯誤、無病毒，也不保證會糾正任何錯誤等。您將獨自承擔因使用或訪問社區模型、下載任何社區模型或使用LM Studio提供或通過LM Studio提供的任何其他社區模型而導致的任何損害。