🚀 QwenStoryteller量化模型項目
本項目提供了QwenStoryteller模型的量化版本,方便用戶在不同場景下高效使用該模型。通過量化處理,模型在保持一定性能的同時,能減少存儲空間和計算資源的需求。
📚 詳細文檔
基本信息
屬性 |
詳情 |
基礎模型 |
daniel3303/QwenStoryteller |
數據集 |
daniel3303/StoryReasoning |
語言 |
英文 |
庫名稱 |
transformers |
許可證 |
apache - 2.0 |
量化者 |
mradermacher |
標籤 |
視覺語言模型、視覺故事講述、思維鏈、基於文本生成、跨幀一致性、故事講述、圖像轉文本 |
關於模型
加權/矩陣量化版本來自於 https://huggingface.co/daniel3303/QwenStoryteller。靜態量化版本可在 https://huggingface.co/mradermacher/QwenStoryteller - GGUF 獲取。
使用說明
如果您不確定如何使用GGUF文件,請參考 TheBloke的README 以獲取更多詳細信息,包括如何拼接多部分文件。
提供的量化版本
(按大小排序,不一定代表質量。IQ量化通常優於類似大小的非IQ量化)
鏈接 |
類型 |
大小(GB) |
說明 |
GGUF |
i1 - IQ1_S |
2.0 |
適用於資源極度緊張的情況 |
GGUF |
i1 - IQ1_M |
2.1 |
多數情況下用於資源緊張場景 |
GGUF |
i1 - IQ2_XXS |
2.4 |
|
GGUF |
i1 - IQ2_XS |
2.6 |
|
GGUF |
i1 - IQ2_S |
2.7 |
|
GGUF |
i1 - IQ2_M |
2.9 |
|
GGUF |
i1 - Q2_K_S |
2.9 |
質量非常低 |
GGUF |
i1 - Q2_K |
3.1 |
IQ3_XXS可能更好 |
GGUF |
i1 - IQ3_XXS |
3.2 |
質量較低 |
GGUF |
i1 - IQ3_XS |
3.4 |
|
GGUF |
i1 - Q3_K_S |
3.6 |
IQ3_XS可能更好 |
GGUF |
i1 - IQ3_S |
3.6 |
優於Q3_K* |
GGUF |
i1 - IQ3_M |
3.7 |
|
GGUF |
i1 - Q3_K_M |
3.9 |
IQ3_S可能更好 |
GGUF |
i1 - Q3_K_L |
4.2 |
IQ3_M可能更好 |
GGUF |
i1 - IQ4_XS |
4.3 |
|
GGUF |
i1 - IQ4_NL |
4.5 |
優先選擇IQ4_XS |
GGUF |
i1 - Q4_0 |
4.5 |
速度快,質量低 |
GGUF |
i1 - Q4_K_S |
4.6 |
大小/速度/質量最優 |
GGUF |
i1 - Q4_K_M |
4.8 |
速度快,推薦使用 |
GGUF |
i1 - Q4_1 |
5.0 |
|
GGUF |
i1 - Q5_K_S |
5.4 |
|
GGUF |
i1 - Q5_K_M |
5.5 |
|
GGUF |
i1 - Q6_K |
6.4 |
實際上類似於靜態Q6_K |
ikawrakow提供了一個方便的圖表,用於比較一些低質量量化類型(數值越低越好):

此外,Artefact2對此也有相關看法:https://gist.github.com/Artefact2/b5f810600771265fc1e39442288e8ec9
常見問題解答/模型請求
有關常見問題的解答,以及如果您希望對其他模型進行量化,請參考 https://huggingface.co/mradermacher/model_requests。
致謝
感謝我的公司 nethype GmbH,允許我使用其服務器,並對我的工作站進行升級,使我能夠在業餘時間完成這項工作。此外,感謝 @nicoboss 讓我使用他的私人超級計算機,使我能夠提供更多、質量更高的矩陣量化版本。
📄 許可證
本項目採用apache - 2.0許可證。