G

Gpt J Fourchannel 4bit

由autobots開發
該模型已轉換為GPTQ-v2和GGML格式,支持CPU運行,適用於量化推理任務。
下載量 39
發布時間 : 4/15/2023

模型概述

該模型經過量化處理,提供多種配置選項(如分組大小和激活順序優化),適合資源受限環境下的高效推理。

模型特點

多格式支持
提供GPTQ-v2和GGML兩種量化格式,滿足不同部署需求。
CPU兼容性
GGML格式專為CPU優化,無需GPU即可運行。
量化配置選項
支持128分組大小和激活順序優化等不同量化參數組合。

模型能力

量化推理
低資源部署
英語文本生成

使用案例

邊緣計算
嵌入式設備部署
在資源受限設備上運行文本生成模型
通過量化實現內存佔用降低
開發測試
量化技術驗證
比較不同量化配置的性能差異
獲得最優量化方案
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase