Psyonic-Cetacean-Ultra-Quality-20b-GGUF-imat-plus2開源大模型

首頁

Psyonic Cetacean Ultra Quality 20b GGUF Imat Plus2

由DavidAU開發

32位浮點數升級版大語言模型，通過全組件FP32重製顯著提升文本生成質量與量化性能

大型語言模型英語開源協議:Apache-2.0 #32位浮點高精度 #角色扮演優化 #量化性能突破

下載量 3,536

發布時間 : 4/25/2025

模型概述

超高質量重製版大語言模型，專注於創意寫作、故事生成和角色扮演場景，通過數學嚴謹的精度保持方法實現性能躍升

模型特點

全FP32精度重製

所有組件和合並模型均升級為32位浮點精度，最大限度減少累積精度損失

量化性能突破

Q6版本性能超越原版全精度模型，Q4KM接近原版Q6質量水平

Imatrix Plus 2量化

採用內部數據集與主數據集融合的新型量化技術，困惑度降幅翻倍

湧現新能力

指令跟隨能力顯著提升，文本表現力和細節深度全面提高

模型能力

創意寫作

故事生成

小說續寫

角色扮演對話

指令跟隨

使用案例

創意寫作

科幻小說創作

生成具有豐富細節的科幻場景和角色設定

輸出文本表現力提升，細節深度增加

故事續寫

根據用戶提供的開頭自動生成連貫的故事發展

情節連貫性提高，邏輯錯誤減少

交互式應用

角色扮演聊天

在Silly Tavern等平臺實現高質量角色互動

對話自然度提升，角色一致性增強

🚀 超高質量重製版：Psyonic - Cetacean 20b - Imatrix Plus 2

這是一款令人驚歎的超高質量重製版模型，專注於提升文本生成的精度和性能。它通過將所有組件和合並操作升級到浮點32位，顯著減少了模型在處理過程中的損失，從而在困惑度指標上取得了顯著的提升。

🚀 快速開始

本倉庫包含了新的Imatrix Plus 2量化版本，它使用了內部新數據集與主數據集合並，進一步提升了超高質量重製版的性能。

✨ 主要特性

浮點32位升級：所有組件和合並操作都重製為浮點32位，包括所有合併（使用主文件重新創建），並儘可能替換為完整的FP32模型。
高精度保留：在模型處理的每個步驟中都儘可能保留最大精度，直至“GUFF”處理階段。
性能顯著提升：在不同量化級別下，困惑度均有顯著下降，如Q2K下降533點、Q4KM下降976點、Q6下降234點等。
多樣化應用設置：適用於聊天、角色扮演等場景，可通過調整“平滑因子”等參數優化模型運行效果。

📦 安裝指南

暫未提及具體安裝步驟，可參考模型源版本及配置文件：[https://huggingface.co/collections/DavidAU/d - au - source - files - for - gguf - exl2 - awq - gptq - hqq - etc - etc - 66b55cb8ba25f914cbf210be](https://huggingface.co/collections/DavidAU/d - au - source - files - for - gguf - exl2 - awq - gptq - hqq - etc - etc - 66b55cb8ba25f914cbf210be)

💻 使用示例

基礎用法

在“KoboldCpp”、“oobabooga/text - generation - webui”或“Silly Tavern”中使用該模型時，可按以下設置優化性能：

在“KoboldCpp”或  “oobabooga/text - generation - webui”或“Silly Tavern”中；
將“Smoothing_factor”設置為1.5到2.5 
- 在KoboldCpp -> Settings -> Samplers -> Advanced -> "Smooth_F"
- 在text - generation - webui -> parameters -> 右下角
- 在Silly Tavern中此設置稱為：“Smoothing”

高級用法

注意：對於“text - generation - webui”，如果使用GGUFs，需要使用“llama_HF”（這涉及從該模型的源版本下載一些配置文件）。
其他選項：
- 將重複懲罰提高到1.1到1.15（如果使用“smoothing_factor”則無需此操作）
- 如果運行AI模型的界面/程序支持“二次採樣”（“平滑”），按說明進行調整

📚 詳細文檔

關於該模型的所有設置（包括其“類別”的具體設置）、示例生成以及高級設置指南（通常可解決任何模型問題），包括針對所有用例（如聊天、角色扮演等）提高模型性能的方法，請參考：[https://huggingface.co/DavidAU/Maximizing - Model - Performance - All - Quants - Types - And - Full - Precision - by - Samplers_Parameters](https://huggingface.co/DavidAU/Maximizing - Model - Performance - All - Quants - Types - And - Full - Precision - by - Samplers_Parameters)