開源Kuvera-8B大語言模型，專注金融理財，多量化版適配不同硬件！

首頁

Akhil Theerthala Kuvera 8B V0.1.0 GGUF

由bartowski開發

Kuvera-8B是一個專注於金融和個人理財領域的8B參數大語言模型，提供多種量化版本以適應不同硬件需求。

大型語言模型英語開源協議:MIT #金融文本生成 #多量化選擇 #低內存優化

下載量 793

發布時間 : 6/6/2025

模型概述

該模型是Akhil-Theerthala的Kuvera-8B-v0.1.0的量化版本，利用llamacpp進行量化處理，特別適用於金融、個人理財等領域的文本生成任務。

模型特點

多種量化類型

提供從bf16到IQ2_M等多種量化類型，滿足不同性能和質量需求。

在線重打包

支持在線重打包優化，自動提升ARM和AVX機器上的性能。

金融領域優化

專門針對金融和個人理財領域進行優化，適合相關文本生成任務。

靈活部署

支持在LM Studio、llama.cpp等多種平臺上運行，部署靈活。

模型能力

金融文本生成

個人理財建議生成

金融數據分析

專業領域問答

使用案例

金融諮詢

投資建議生成

根據用戶財務狀況生成個性化的投資建議。

理財規劃

幫助用戶制定長期理財規劃方案。

金融教育

金融知識問答

回答用戶關於金融基礎知識的各種問題。

🚀 Akhil - Theerthala的Kuvera - 8B - v0.1.0的Llamacpp imatrix量化版本

本項目是Akhil - Theerthala的Kuvera - 8B - v0.1.0模型的量化版本，利用llamacpp進行量化處理，可用於金融、個人理財等領域的文本生成任務。

🚀 快速開始

使用 llama.cpp 版本 b5596 進行量化。原始模型地址：https://huggingface.co/Akhil - Theerthala/Kuvera - 8B - v0.1.0

所有量化模型均使用imatrix選項，並採用來自此處的數據集生成。

你可以在 LM Studio 中運行這些量化模型，也可以直接使用 llama.cpp 或任何基於llama.cpp的項目來運行。

✨ 主要特性

多種量化類型：提供了豐富的量化類型供選擇，如bf16、Q8_0、Q6_K_L等，以滿足不同的性能和質量需求。
在線重打包：部分量化模型支持在線重打包，可自動優化ARM和AVX機器上的性能。
靈活下載：支持使用huggingface - cli下載特定文件或整個模型分支。

📦 安裝指南

使用huggingface - cli下載

首先，確保你已經安裝了huggingface - cli：

pip install -U "huggingface_hub[cli]"

然後，你可以指定要下載的特定文件：

huggingface-cli download bartowski/Akhil-Theerthala_Kuvera-8B-v0.1.0-GGUF --include "Akhil-Theerthala_Kuvera-8B-v0.1.0-Q4_K_M.gguf" --local-dir ./

如果模型大小超過50GB，它會被拆分為多個文件。若要將它們全部下載到本地文件夾，請運行：

huggingface-cli download bartowski/Akhil-Theerthala_Kuvera-8B-v0.1.0-GGUF --include "Akhil-Theerthala_Kuvera-8B-v0.1.0-Q8_0/*" --local-dir ./

你可以指定一個新的本地目錄（如Akhil - Theerthala_Kuvera - 8B - v0.1.0 - Q8_0），也可以將它們全部下載到當前目錄（./）。

💻 使用示例

提示格式

<|im_start|>system
{system_prompt}<|im_end|>
<|im_start|>user
{prompt}<|im_end|>
<|im_start|>assistant

📚 詳細文檔

下載文件列表

文件名	量化類型	文件大小	拆分情況	描述
Kuvera-8B-v0.1.0-bf16.gguf	bf16	16.39GB	false	完整的BF16權重。
Kuvera-8B-v0.1.0-Q8_0.gguf	Q8_0	8.71GB	false	極高質量，通常不需要，但為最大可用量化。
Kuvera-8B-v0.1.0-Q6_K_L.gguf	Q6_K_L	7.03GB	false	嵌入和輸出權重使用Q8_0。非常高質量，接近完美，推薦。
Kuvera-8B-v0.1.0-Q6_K.gguf	Q6_K	6.73GB	false	非常高質量，接近完美，推薦。
Kuvera-8B-v0.1.0-Q5_K_L.gguf	Q5_K_L	6.24GB	false	嵌入和輸出權重使用Q8_0。高質量，推薦。
Kuvera-8B-v0.1.0-Q5_K_M.gguf	Q5_K_M	5.85GB	false	高質量，推薦。
Kuvera-8B-v0.1.0-Q5_K_S.gguf	Q5_K_S	5.72GB	false	高質量，推薦。
Kuvera-8B-v0.1.0-Q4_K_L.gguf	Q4_K_L	5.49GB	false	嵌入和輸出權重使用Q8_0。質量良好，推薦。
Kuvera-8B-v0.1.0-Q4_1.gguf	Q4_1	5.25GB	false	舊格式，性能與Q4_K_S相似，但在Apple硅芯片上每瓦處理的令牌數有所提高。
Kuvera-8B-v0.1.0-Q4_K_M.gguf	Q4_K_M	5.03GB	false	質量良好，是大多數用例的默認大小，推薦。
Kuvera-8B-v0.1.0-Q3_K_XL.gguf	Q3_K_XL	4.98GB	false	嵌入和輸出權重使用Q8_0。質量較低但可用，適合低內存情況。
Kuvera-8B-v0.1.0-Q4_K_S.gguf	Q4_K_S	4.80GB	false	質量稍低，但節省空間，推薦。
Kuvera-8B-v0.1.0-Q4_0.gguf	Q4_0	4.79GB	false	舊格式，支持ARM和AVX CPU推理的在線重打包。
Kuvera-8B-v0.1.0-IQ4_NL.gguf	IQ4_NL	4.79GB	false	與IQ4_XS相似，但稍大。支持ARM CPU推理的在線重打包。
Kuvera-8B-v0.1.0-IQ4_XS.gguf	IQ4_XS	4.56GB	false	質量不錯，比Q4_K_S小，性能相似，推薦。
Kuvera-8B-v0.1.0-Q3_K_L.gguf	Q3_K_L	4.43GB	false	質量較低但可用，適合低內存情況。
Kuvera-8B-v0.1.0-Q3_K_M.gguf	Q3_K_M	4.12GB	false	質量低。
Kuvera-8B-v0.1.0-IQ3_M.gguf	IQ3_M	3.90GB	false	中低質量，新方法，性能與Q3_K_M相當。
Kuvera-8B-v0.1.0-Q2_K_L.gguf	Q2_K_L	3.89GB	false	嵌入和輸出權重使用Q8_0。質量非常低，但令人驚訝地可用。
Kuvera-8B-v0.1.0-Q3_K_S.gguf	Q3_K_S	3.77GB	false	質量低，不推薦。
Kuvera-8B-v0.1.0-IQ3_XS.gguf	IQ3_XS	3.63GB	false	質量較低，新方法，性能不錯，略優於Q3_K_S。
Kuvera-8B-v0.1.0-IQ3_XXS.gguf	IQ3_XXS	3.37GB	false	質量較低，新方法，性能不錯，與Q3量化相當。
Kuvera-8B-v0.1.0-Q2_K.gguf	Q2_K	3.28GB	false	質量非常低，但令人驚訝地可用。
Kuvera-8B-v0.1.0-IQ2_M.gguf	IQ2_M	3.05GB	false	質量相對較低，使用了最先進的技術，令人驚訝地可用。