inclusionAI_Ling-lite-0415-GGUF開源模型 - 多種量化適配不同硬件

首頁

Inclusionai Ling Lite 0415 GGUF

由bartowski開發

基於inclusionAI/Ling-lite的量化版本，使用llama.cpp進行imatrix量化，支持多種量化類型以適應不同硬件需求。

大型語言模型開源協議:MIT #多量化版本 #低資源部署 #文本生成

下載量 3,112

發布時間 : 4/21/2025

模型概述

這是一個文本生成模型，經過量化處理以優化在不同硬件上的運行效率，同時保持較高的生成質量。

模型特點

多種量化選項

提供從BF16到IQ2_XS等多種量化類型，適應不同硬件和性能需求。

高質量文本生成

即使在高壓縮比的量化下，仍能保持較高的文本生成質量。

硬件兼容性

支持在LM Studio、llama.cpp及基於llama.cpp的項目中運行，兼容多種硬件平臺。

模型能力

文本生成

多輪對話

支持結構化提示

使用案例

對話系統

智能助手

可用於構建智能對話助手，處理用戶查詢和任務。

內容生成

創意寫作

輔助進行故事創作、詩歌生成等創意寫作任務。

🚀 inclusionAI的Ling - lite - 0415的Llamacpp imatrix量化版本

本項目提供了inclusionAI的Ling - lite - 0415模型的量化版本，藉助量化技術可在不同硬件條件下更高效地運行模型，滿足多樣化的使用需求。

🚀 快速開始

你可以在 LM Studio 中運行這些量化模型，也能直接使用 llama.cpp 或其他基於 llama.cpp 的項目來運行。

✨ 主要特性

多種量化類型：提供了豐富的量化類型供選擇，如 bf16、Q8_0、Q6_K_L 等，可根據不同的硬件資源和性能需求進行挑選。
在線重打包：部分量化類型支持在線重打包功能，能自動優化權重以提升在 ARM 和 AVX 機器上的性能。
靈活下載：支持使用 huggingface - cli 靈活下載單個文件或整個模型分支。

📦 安裝指南

安裝 huggingface - cli

首先，確保你已安裝 huggingface - cli：

pip install -U "huggingface_hub[cli]"

下載指定文件

你可以指定要下載的特定文件：

huggingface-cli download bartowski/inclusionAI_Ling-lite-0415-GGUF --include "inclusionAI_Ling-lite-0415-Q4_K_M.gguf" --local-dir ./

下載拆分文件

如果模型大於 50GB，它會被拆分為多個文件。若要將它們全部下載到本地文件夾，可運行：

huggingface-cli download bartowski/inclusionAI_Ling-lite-0415-GGUF --include "inclusionAI_Ling-lite-0415-Q8_0/*" --local-dir ./

你可以指定一個新的本地目錄（如 inclusionAI_Ling - lite - 0415 - Q8_0），也可以將它們全部下載到當前目錄（./）。

💻 使用示例

基礎用法

提示格式

<role>SYSTEM</role>{system_prompt}<role>HUMAN</role>{prompt}<role>ASSISTANT</role><role>ASSISTANT</role>

📚 詳細文檔

下載文件列表

文件名	量化類型	文件大小	拆分情況	描述
Ling-lite-0415-bf16.gguf	bf16	33.62GB	false	完整的 BF16 權重。
Ling-lite-0415-Q8_0.gguf	Q8_0	17.87GB	false	極高質量，通常不需要，但為最大可用量化。
Ling-lite-0415-Q6_K_L.gguf	Q6_K_L	15.18GB	false	嵌入和輸出權重使用 Q8_0。非常高質量，接近完美，推薦。
Ling-lite-0415-Q6_K.gguf	Q6_K	15.05GB	false	非常高質量，接近完美，推薦。
Ling-lite-0415-Q5_K_L.gguf	Q5_K_L	12.91GB	false	嵌入和輸出權重使用 Q8_0。高質量，推薦。
Ling-lite-0415-Q5_K_M.gguf	Q5_K_M	12.75GB	false	高質量，推薦。
Ling-lite-0415-Q5_K_S.gguf	Q5_K_S	11.93GB	false	高質量，推薦。
Ling-lite-0415-Q4_K_L.gguf	Q4_K_L	11.37GB	false	嵌入和輸出權重使用 Q8_0。質量良好，推薦。
Ling-lite-0415-Q4_K_M.gguf	Q4_K_M	11.18GB	false	質量良好，大多數用例的默認大小，推薦。
Ling-lite-0415-Q4_1.gguf	Q4_1	10.57GB	false	舊格式，性能與 Q4_K_S 相似，但在 Apple silicon 上每瓦令牌數有所提高。
Ling-lite-0415-Q4_K_S.gguf	Q4_K_S	10.22GB	false	質量稍低，但節省更多空間，推薦。
Ling-lite-0415-Q4_0.gguf	Q4_0	9.57GB	false	舊格式，可為 ARM 和 AVX CPU 推理提供在線重打包。
Ling-lite-0415-IQ4_NL.gguf	IQ4_NL	9.54GB	false	與 IQ4_XS 相似，但稍大。可為 ARM CPU 推理提供在線重打包。
Ling-lite-0415-Q3_K_XL.gguf	Q3_K_XL	9.30GB	false	嵌入和輸出權重使用 Q8_0。質量較低但可用，適合低內存情況。
Ling-lite-0415-IQ4_XS.gguf	IQ4_XS	9.19GB	false	質量不錯，比 Q4_K_S 小，性能相似，推薦。
Ling-lite-0415-Q3_K_L.gguf	Q3_K_L	9.07GB	false	質量較低但可用，適合低內存情況。
Ling-lite-0415-Q3_K_M.gguf	Q3_K_M	8.73GB	false	低質量。
Ling-lite-0415-IQ3_M.gguf	IQ3_M	8.12GB	false	中低質量，新方法，性能與 Q3_K_M 相當。
Ling-lite-0415-Q3_K_S.gguf	Q3_K_S	8.03GB	false	低質量，不推薦。
Ling-lite-0415-IQ3_XS.gguf	IQ3_XS	7.65GB	false	質量較低，新方法，性能不錯，略優於 Q3_K_S。
Ling-lite-0415-IQ3_XXS.gguf	IQ3_XXS	7.47GB	false	質量較低，新方法，性能不錯，與 Q3 量化相當。
Ling-lite-0415-Q2_K_L.gguf	Q2_K_L	7.16GB	false	嵌入和輸出權重使用 Q8_0。質量非常低，但出人意料地可用。
Ling-lite-0415-Q2_K.gguf	Q2_K	6.91GB	false	質量非常低，但出人意料地可用。
Ling-lite-0415-IQ2_M.gguf	IQ2_M	6.80GB	false	質量相對較低，使用了最先進的技術，出人意料地可用。
Ling-lite-0415-IQ2_S.gguf	IQ2_S	6.45GB	false	質量低，使用了最先進的技術，可用。
Ling-lite-0415-IQ2_XS.gguf	IQ2_XS	6.41GB	false	質量低，使用了最先進的技術，可用。