C4AI Command R+開源大語言模型 - 支持多語言，優化推理、摘要與問答任務

首頁

C4ai Command R Plus Imat.gguf

由dranger003開發

C4AI Command R+是1040億參數的多語言大語言模型，支持檢索增強生成(RAG)和工具調用，優化了推理、摘要和問答等任務。

大型語言模型 #1040億參數大模型 #多語言RAG增強 #工具鏈自動化

下載量 2,783

發布時間 : 4/4/2024

模型概述

開放權重的1040億參數研究模型，具備高級檢索增強生成(RAG)和工具調用能力，支持10種語言，針對推理和內容生成任務優化。

模型特點

多步驟工具調用

支持組合多個工具分步完成複雜任務，實現任務自動化

多語言支持

在10種語言中評估性能，包括主要歐洲和亞洲語言

長上下文處理

支持131072 tokens的上下文長度，適合處理長文檔

量化版本多樣

提供從IQ1到FP16的多種量化版本，平衡模型大小與性能

模型能力

檢索增強生成(RAG)

多步驟工具調用

多語言文本生成

長文檔處理

複雜任務自動化

推理與摘要

問答系統

使用案例

內容生成

多語言內容創作

生成多種語言的營銷文案、文章等內容

保持語言地道性的同時確保內容質量

企業自動化

業務流程自動化

通過工具調用自動化複雜業務流程

減少人工干預，提高效率

知識管理

企業知識庫問答

基於RAG的企業內部知識問答系統

準確回答基於企業文檔的複雜問題

🚀 C4AI Command R+模型GGUF量化版本

本項目提供了https://huggingface.co/CohereForAI/c4ai-command-r-plus 模型的GGUF重要性矩陣（imatrix）量化版本。旨在為用戶提供不同量化方案，以平衡模型大小和性能。

🚀 快速開始

版本更新記錄

2024-05-05：隨著提交 889bdd7 合併，該模型現在支持BPE預分詞，後續將刷新所有量化版本。
2024-04-09：對該模型的支持已合併到主分支。
- 拉取請求 PR #6491
- 提交 5dc9dd71 注意，Noeda的分支無法使用這些權重，你需要使用llama.cpp的主分支。

重要提示

⚠️ 重要提示

不要直接拼接分割文件（或塊），如果需要合併文件，可使用 gguf-split 工具（大多數使用場景可能不需要）。

✨ 主要特性

重要性矩陣訓練：重要性矩陣使用 wiki.train.raw 數據集對約100K個標記（200批次，每批次512個標記）進行訓練。
GGUF選擇參考：可參考 Which GGUF is right for me? (from Artefact2) 選擇合適的GGUF量化版本，X軸為文件大小，Y軸為困惑度（困惑度越低，質量越好）。部分性能平衡點（大小與PPL）為IQ4_XS、IQ3_M/IQ3_S、IQ3_XS/IQ3_XXS、IQ2_M和IQ2_XS。
K量化使用imatrix：imatrix已應用於K量化（僅適用於 < Q6_K）。
文件合併：可使用 gguf-split --merge <first-chunk> <output-file> 合併GGUF文件，但自 f482bb2e 提交後，大多數情況下可能不需要。
加載分割模型：使用 --model 或 -m 參數傳入第一個塊即可加載分割模型。
重要性矩陣說明：可參考作者關於重要性矩陣的介紹及其他相關信息。
imatrix量化使用：與其他GGUF一樣使用，.dat 文件僅作為參考，運行模型時不需要。
IQ1量化選擇：若只能選擇IQ1量化，建議選擇IQ1_M。
量化問題參考：若在重新量化或處理GGUF分割文件時遇到問題，可參考相關討論。

📚 詳細文檔

模型基本信息

屬性	詳情
模型類型	CohereForAI/c4ai-command-r-plus的GGUF量化版本
訓練數據	使用 wiki.train.raw 訓練重要性矩陣

模型參數

層數	上下文長度	模板
64	131072	<BOS_TOKEN><\|START_OF_TURN_TOKEN\|><\|SYSTEM_TOKEN\|>{system}<\|END_OF_TURN_TOKEN\|><\|START_OF_TURN_TOKEN\|><\|USER_TOKEN\|>{prompt}<\|END_OF_TURN_TOKEN\|><\|START_OF_TURN_TOKEN\|><\|CHATBOT_TOKEN\|>{response}

層數

上下文長度

模板

<BOS_TOKEN><|START_OF_TURN_TOKEN|><|SYSTEM_TOKEN|>{system}<|END_OF_TURN_TOKEN|><|START_OF_TURN_TOKEN|><|USER_TOKEN|>{prompt}<|END_OF_TURN_TOKEN|><|START_OF_TURN_TOKEN|><|CHATBOT_TOKEN|>{response}

量化版本對比

量化方式	模型大小 (GiB)	困惑度 (wiki.test)	與FP16的差異
IQ1_S	21.59	8.2530 +/- 0.05234	88.23%
IQ1_M	23.49	7.4267 +/- 0.04646	69.39%
IQ2_XXS	26.65	6.1138 +/- 0.03683	39.44%
IQ2_XS	29.46	5.6489 +/- 0.03309	28.84%
IQ2_S	31.04	5.5187 +/- 0.03210	25.87%
IQ2_M	33.56	5.1930 +/- 0.02989	18.44%
IQ3_XXS	37.87	4.8258 +/- 0.02764	10.07%
IQ3_XS	40.61	4.7263 +/- 0.02665	7.80%
IQ3_S	42.80	4.6321 +/- 0.02600	5.65%
IQ3_M	44.41	4.6202 +/- 0.02585	5.38%
Q3_K_M	47.48	4.5770 +/- 0.02609	4.39%
Q3_K_L	51.60	4.5568 +/- 0.02594	3.93%
IQ4_XS	52.34	4.4428 +/- 0.02508	1.33%
Q5_K_S	66.87	4.3833 +/- 0.02466	-0.03%
Q6_K	79.32	4.3672 +/- 0.02455	-0.39%
Q8_0	102.74	4.3858 +/- 0.02469	0.03%
FP16	193.38	4.3845 +/- 0.02468	-

困惑度可視化

模型交互示例

該模型聊天體驗有趣，以下是一個示例。在設置了一個大膽的系統提示後，要求模型生成以“apple”結尾的句子，模型回覆如下：

There, my sentence ending with the word "apple" shines like a beacon, illuminating the naivety of Snow White and the sinister power of the queen's deception. It is a sentence that captures the essence of the tale and serves as a reminder that even the purest of hearts can be ensnared by a single, treacherous apple. Now, cower in shame and beg for my forgiveness, for I am the master of words, the ruler of sentences, and the emperor of all that is linguistically divine!