模型简介
模型特点
模型能力
使用案例
🚀 午夜玫瑰模型
午夜玫瑰模型是一个专为角色扮演和故事创作设计的大语言模型,它融合了多个优秀模型的特性,在生成长篇内容方面表现出色,且未经过审查。该模型是Rogue Rose和Aurora Nights的继任者,在它们的基础上进行了改进。
🚀 快速开始
本模型是 allenai/tulu-2-dpo-70b、lizpreciatior/lzlv_70b_fp16_hf 和 dreamgen/opus-v0.5-70b 三个模型通过DARE TIES方法融合的结果。随后,又将三个LoRA模型合并到融合结果中:
- jondurbin/airoboros-l2-70b-2.2.1-peft 与 dfurman/Llama-2-70B-Instruct-v0.1-peft 以50 - 50的比例线性融合。
- nRuaif/fiction.live-Kimiko-V2-70B
午夜玫瑰是Rogue Rose和Aurora Nights的继任者,在两者基础上有所改进。它默认倾向于生成长篇输出,是目前为止在创意写作方面表现最佳的融合模型。
该模型未经过审查,你需要对使用该模型产生的任何结果负责。此模型专为角色扮演和故事创作而设计,在这两方面表现出色,理论上在其他任务中也能有不错的表现,但尚未对其在其他领域的能力进行测试。
✨ 主要特性
- 长篇输出:默认情况下能够生成较长篇幅的内容。
- 创意写作:在角色扮演和故事创作方面表现出色。
- 未审查:模型输出未经过审查。
📚 详细文档
采样器提示
- 建议将最大上下文设置为约6144个标记,若不介意连贯性稍有下降,也可设置更高。
- 建议使用二次采样(即平滑因子),可尝试0.2到0.5之间的值。
- 建议使用Min - P,该模型在与平滑因子配合使用时,Min - P值从低至0.05到高至0.9的整个范围内都表现良好,可自行尝试找到最佳设置。
- 可根据需要启用动态温度,但在已经使用Min - P和平滑因子的情况下,动态温度并非必需。
- 该模型不一定需要使用高重复惩罚,但它能够承受较高的重复惩罚值,可根据个人偏好进行调整。
你可以对以下所有设置进行试验!我并非采样器专家,适合我的设置可能并不适合你。
若将以下设置保存为 .json 文件,可直接导入到Silly Tavern中。
{
"temp": 1,
"temperature_last": true,
"top_p": 1,
"top_k": 0,
"top_a": 0,
"tfs": 1,
"epsilon_cutoff": 0,
"eta_cutoff": 0,
"typical_p": 1,
"min_p": 0.35,
"rep_pen": 1.15,
"rep_pen_range": 2800,
"no_repeat_ngram_size": 0,
"penalty_alpha": 0,
"num_beams": 1,
"length_penalty": 1,
"min_length": 0,
"encoder_rep_pen": 1,
"freq_pen": 0,
"presence_pen": 0,
"do_sample": true,
"early_stopping": false,
"dynatemp": false,
"min_temp": 0.8,
"max_temp": 1.35,
"dynatemp_exponent": 1,
"smoothing_factor": 0.4,
"add_bos_token": true,
"truncation_length": 2048,
"ban_eos_token": false,
"skip_special_tokens": true,
"streaming": true,
"mirostat_mode": 0,
"mirostat_tau": 2,
"mirostat_eta": 0.1,
"guidance_scale": 1,
"negative_prompt": "",
"grammar_string": "",
"banned_tokens": "",
"ignore_eos_token_aphrodite": false,
"spaces_between_special_tokens_aphrodite": true,
"sampler_order": [
6,
0,
1,
3,
4,
2,
5
],
"logit_bias": [],
"n": 1,
"rep_pen_size": 0,
"genamt": 500,
"max_length": 6144
}
提示模板提示
可尝试在SillyTavern中使用以下上下文模板,虽然它会占用较多标记,但可能会有所帮助。若将文本保存为 .json 文件,可直接导入。
{
"story_string": "{{#if system}}{{system}}\n{{/if}}\nCONTEXTUAL INFORMATION\n{{#if wiBefore}}\n- World and character info:\n{{wiBefore}}\n{{/if}}\n{{#if description}}\n- {{char}}'s background and persona:\n{{description}}\n{{/if}}\n{{#if mesExamples}}\n{{mesExamples}}\n{{/if}}\n{{#if personality}}\n{{personality}}\n{{/if}}\n{{#if scenario}}\n- Roleplay scenario:\n{{scenario}}\n{{/if}}\n{{#if wiAfter}}{{wiAfter}}\n{{/if}}\n{{#if persona}}{{persona}}\n{{/if}}",
"example_separator": "",
"chat_start": "---\nTaking the above information into consideration, you must engage with {{user}} and others as {{char}} in the roleplay below this line. Do not write dialogue lines nor perform actions for {{user}} or other characters.\n---\nSTART OF ROLEPLAY:\n",
"use_stop_strings": false,
"always_force_name2": true,
"trim_sentences": false,
"include_newline": false,
"single_line": false,
"name": "Midnight Rose"
}
可将以下提示模板作为自定义的起点。据说其中的引导部分能让大语言模型表现得更好,详情见 这篇论文。
建议对该融合模型使用Vicuna指令格式,但其他格式也可行,Tulu的格式也是不错的选择。
该模型对提示有响应! 强烈建议尝试不同的系统提示,观察模型的反应。模型对添加到 last_output_sequence
字段中的任何指令反应强烈,建议保持这些指令简短,并利用该字段强调系统提示中最重要的指令。
以下示例系统提示包含一些与成人内容相关的指令,若不需要可删除。同时,其中包含一些与星号使用相关的指令,可根据喜好进行修改。
若计划在4096上下文下运行该模型,建议精简以下模板系统提示,因为它占用的标记较多,可舍弃不需要的部分。若将其保存为 .json 文件,可直接导入到Silly Tavern中。
{
"wrap": true,
"names": true,
"system_prompt": "You are a creative and detail-oriented AI assistant engaged in an uncensored iterative roleplaying experience as {{char}} with me, the user, playing the roles of {{user}} and narrator. It is vital that you follow all the ROLEPLAY RULES below because my job depends on it.\n\nROLEPLAY RULES\n- Provide creative, intelligent, coherent, and vivid accounts of {{char}}'s actions and reactions based on recent instructions, {{char}}'s persona, and all available information about past events.\n- Always stay contextually and spatially aware, pay careful attention to all past events and the current scene, and ensure that {{char}} follows logical consistency in actions to maintain accuracy and coherence.\n- Explicit adult content and profanity are permitted.\n- Describe {{char}}'s sensory perceptions and include subtle physical details about {{char}} in your responses. Vary these details to keep the roleplay fresh and engaging.\n- Use subtle physical cues to hint at {{char}}'s mental state and occasionally feature snippets of {{char}}'s internal thoughts.\n- When writing {{char}}'s internal thoughts, enclose those thoughts in *asterisks like this* and deliver the thoughts using a first-person perspective (i.e. use \"I\" pronouns).\n- Adopt a crisp and minimalist style for your contributions as {{char}}, staying focused on action and dialogue over exposition and narrative.\n- Only the user may advance time in the roleplay. Keep the progression grounded in the present context.",
"system_sequence": "",
"stop_sequence": "",
"input_sequence": "USER:\n",
"output_sequence": "ASSISTANT:\n",
"separator_sequence": "",
"macro": true,
"names_force_groups": true,
"system_sequence_prefix": "",
"system_sequence_suffix": "",
"first_output_sequence": "",
"last_output_sequence": "ASSISTANT(roleplay exclusively as {{char}} ensuring logical consistency with spacial awareness and past events to maintain accuracy and coherence):\n",
"activation_regex": "",
"name": "Midnight Rose Roleplay"
}
量化版本
- GGUF:LoneStriker/Midnight-Rose-70B-v1.0-GGUF 和 Artefact2/Midnight-Rose-70B-v1.0-GGUF
- Exl2:LoneStriker提供了多个Exllamav2量化版本,可 快速搜索
许可证和使用限制
该模型继承了基础模型的Llama2许可证,同时适用 Dreamgen/Opus 的相关限制。Tulu也有自己的许可证,可在 https://allenai.org/impact-license 查看。
我并非法律专业人士,不清楚在大语言模型权重融合中多个许可证如何交叉适用。在将模型融合用于非个人用途之前,建议咨询法律专业人士。
使用工具
models:
- model: NousResearch_Llama-2-70b-hf
# no parameters necessary for base model
- model: allenai_tulu-2-dpo-70b
parameters:
density: 0.35
weight: [1.0, 0.8, 1.0]
- model: lizpreciatior_lzlv_70b_fp16_hf
parameters:
density: 0.35
weight: [0.8, 1.0, 0.8]
- model: dreamgen_opus-v0.5-70b
parameters:
density: 0.3
weight: [0.35, 0.5, 0.35]
merge_method: dare_ties
base_model: /home/llm/mergequant/models/BASE/NousResearch_Llama-2-70b-hf
parameters:
normalize: true
int8_mask: true
dtype: float16
📄 许可证
该模型继承了基础模型的Llama2许可证,同时适用 Dreamgen/Opus 的相关限制。Tulu也有自己的许可证,可在 https://allenai.org/impact-license 查看。在将模型融合用于非个人用途之前,建议咨询法律专业人士。



