Psyonic-Cetacean-Ultra-Quality-20b-GGUF-imat-plus2开源大模型

首页

Psyonic Cetacean Ultra Quality 20b GGUF Imat Plus2

由 DavidAU 开发

32位浮点数升级版大语言模型，通过全组件FP32重制显著提升文本生成质量与量化性能

大型语言模型英语开源协议:Apache-2.0 #32位浮点高精度 #角色扮演优化 #量化性能突破

下载量 3,536

发布时间 : 4/25/2025

模型简介

超高质量重制版大语言模型，专注于创意写作、故事生成和角色扮演场景，通过数学严谨的精度保持方法实现性能跃升

模型特点

全FP32精度重制

所有组件和合并模型均升级为32位浮点精度，最大限度减少累积精度损失

量化性能突破

Q6版本性能超越原版全精度模型，Q4KM接近原版Q6质量水平

Imatrix Plus 2量化

采用内部数据集与主数据集融合的新型量化技术，困惑度降幅翻倍

涌现新能力

指令跟随能力显著提升，文本表现力和细节深度全面提高

模型能力

创意写作

故事生成

小说续写

角色扮演对话

指令跟随

使用案例

创意写作

科幻小说创作

生成具有丰富细节的科幻场景和角色设定

输出文本表现力提升，细节深度增加

故事续写

根据用户提供的开头自动生成连贯的故事发展

情节连贯性提高，逻辑错误减少

交互式应用

角色扮演聊天

在Silly Tavern等平台实现高质量角色互动

对话自然度提升，角色一致性增强

🚀 超高质量重制版：Psyonic - Cetacean 20b - Imatrix Plus 2

这是一款令人惊叹的超高质量重制版模型，专注于提升文本生成的精度和性能。它通过将所有组件和合并操作升级到浮点32位，显著减少了模型在处理过程中的损失，从而在困惑度指标上取得了显著的提升。

🚀 快速开始

本仓库包含了新的Imatrix Plus 2量化版本，它使用了内部新数据集与主数据集合并，进一步提升了超高质量重制版的性能。

✨ 主要特性

浮点32位升级：所有组件和合并操作都重制为浮点32位，包括所有合并（使用主文件重新创建），并尽可能替换为完整的FP32模型。
高精度保留：在模型处理的每个步骤中都尽可能保留最大精度，直至“GUFF”处理阶段。
性能显著提升：在不同量化级别下，困惑度均有显著下降，如Q2K下降533点、Q4KM下降976点、Q6下降234点等。
多样化应用设置：适用于聊天、角色扮演等场景，可通过调整“平滑因子”等参数优化模型运行效果。

📦 安装指南

暂未提及具体安装步骤，可参考模型源版本及配置文件：[https://huggingface.co/collections/DavidAU/d - au - source - files - for - gguf - exl2 - awq - gptq - hqq - etc - etc - 66b55cb8ba25f914cbf210be](https://huggingface.co/collections/DavidAU/d - au - source - files - for - gguf - exl2 - awq - gptq - hqq - etc - etc - 66b55cb8ba25f914cbf210be)

💻 使用示例

基础用法

在“KoboldCpp”、“oobabooga/text - generation - webui”或“Silly Tavern”中使用该模型时，可按以下设置优化性能：

在“KoboldCpp”或  “oobabooga/text - generation - webui”或“Silly Tavern”中；
将“Smoothing_factor”设置为1.5到2.5 
- 在KoboldCpp -> Settings -> Samplers -> Advanced -> "Smooth_F"
- 在text - generation - webui -> parameters -> 右下角
- 在Silly Tavern中此设置称为：“Smoothing”

高级用法

注意：对于“text - generation - webui”，如果使用GGUFs，需要使用“llama_HF”（这涉及从该模型的源版本下载一些配置文件）。
其他选项：
- 将重复惩罚提高到1.1到1.15（如果使用“smoothing_factor”则无需此操作）
- 如果运行AI模型的界面/程序支持“二次采样”（“平滑”），按说明进行调整

📚 详细文档

关于该模型的所有设置（包括其“类别”的具体设置）、示例生成以及高级设置指南（通常可解决任何模型问题），包括针对所有用例（如聊天、角色扮演等）提高模型性能的方法，请参考：[https://huggingface.co/DavidAU/Maximizing - Model - Performance - All - Quants - Types - And - Full - Precision - by - Samplers_Parameters](https://huggingface.co/DavidAU/Maximizing - Model - Performance - All - Quants - Types - And - Full - Precision - by - Samplers_Parameters)