开源Metharme-1.3b模型 - 免费部署助力小说创作与对话生成

首页

Metharme 1.3b

由 PygmalionAI 开发

基于Pythia 1.4B去重版开发的指令微调模型，专长于小说创作与对话生成

大型语言模型

Transformers

英语开源协议:Apache-2.0 #虚构创作 #角色扮演对话 #指令微调

下载量 133

发布时间 : 6/2/2023

模型简介

这是一个用于对话、角色扮演和故事创作的指令微调模型，通过监督式微调训练而成，训练数据混合了常规指令数据、角色扮演剧本、虚构故事以及合成生成指令的对话记录。

模型特点

指令微调

通过监督式微调训练，支持多种指令格式的文本生成

角色扮演支持

特别优化了角色扮演场景下的对话生成能力

多轮对话

支持通过特殊标记构建对话历史，实现连贯的多轮交互

模型能力

文本生成

对话系统

故事创作

角色扮演

指令跟随

使用案例

娱乐

文字冒险游戏

作为游戏引擎生成互动式文字冒险场景

能够生成详细的场景描述和可选行动

角色扮演对话

与虚构角色进行互动对话

生成符合角色设定的连贯对话

创意写作

故事创作

根据提示生成虚构故事内容

能够创作连贯的叙事文本

🚀 Metharme 1.3B

Metharme 1.3B 是一个经过指令微调的模型，基于 Pythia 架构，在虚构写作和对话场景中表现出色，为用户提供了更加生动和富有创意的交互体验。

🚀 快速开始

Metharme 1.3B 是一个基于 EleutherAI 的 Pythia 1.4B Deduped 的指令模型。这是一次尝试，旨在获得一个可用于对话、角色扮演和故事写作的模型，并且可以像其他指令模型一样使用自然语言进行引导。有关示例，请参阅下面的提示方式部分。

✨ 主要特性

该模型通过在常规指令数据、角色扮演、虚构故事和带有合成生成指令的对话的混合数据上进行监督微调来进行训练。

📚 详细文档

提示方式

当前模型版本已针对使用三种不同角色的提示进行了训练，这些角色由以下标记表示：<|system|>、<|user|> 和 <|model|>。

提示示例

以下是一个具体示例。假设您有以下系统提示：

这是一个文本冒险游戏。向用户描述场景，并在每一轮为他提供三个选项供其选择。

并且用户输入了以下消息：

开始！

要对模型进行推理，提示应按如下格式设置：

<|system|>这是一个文本冒险游戏。向用户描述场景，并在每一轮为他提供三个选项供其选择。<|user|>开始！<|model|>

模型可能会生成如下内容：

你站在一座古老废弃的房子前。窗户都用木板封住了，周围没有生命的迹象。当你走近时，你注意到里面散发出一种奇怪的感觉。突然，你听到一个声音在呼唤你……“进来吧！”

进入房子。

忽略呼唤，离开。

尽快跑开。

当模型判断响应完成时，它将自动发出文本结束标记 (<|endoftext|>)。

假设用户回复了 进入房子。下一个提示应如下所示：

<|system|>这是一个文本冒险游戏。向用户描述场景，并在每一轮为他提供三个选项供其选择。<|user|>开始！<|model|>你站在一座古老废弃的房子前。窗户都用木板封住了，周围没有生命的迹象。当你走近时，你注意到里面散发出一种奇怪的感觉。突然，你听到一个声音在呼唤你……“进来吧！”

- 进入房子。
- 忽略呼唤，离开。
- 尽快跑开。<|user|>进入房子<|model|>

这可能会生成如下内容：

你进入房子，立刻，一股不安的能量席卷而来。你的感官似乎变得敏锐，但你的头脑却感到模糊。一个身影出现在你面前——一个目光锐利的高个子男人。他用你听不懂的语言跟你说话。

问他想要什么。

攻击他。

逃跑。

同样的过程适用。通常，最好在用户和模型的回合上进行滑动窗口操作，但要将系统提示固定在上下文窗口的开头。

评估指标

该模型使用 EleutherAI 的 lm-evaluation-harness 测试套件进行评估。它在以下任务上进行了评估：

属性	详情
模型类型	基于 Pythia 1.4B Deduped 的指令模型
训练数据	常规指令数据、角色扮演、虚构故事和带有合成生成指令的对话的混合数据

任务	版本	指标	值		标准误差
anli_r1	0	acc	0.3430	±	0.0150
anli_r2	0	acc	0.3330	±	0.0149
anli_r3	0	acc	0.3350	±	0.0136
arc_challenge	0	acc	0.2747	±	0.0130
		acc_norm	0.3114	±	0.0135
arc_easy	0	acc	0.6237	±	0.0099
		acc_norm	0.5631	±	0.0102
boolq	1	acc	0.6214	±	0.0085
cb	1	acc	0.1964	±	0.0536
		f1	0.1712
hellaswag	0	acc	0.4295	±	0.0049
		acc_norm	0.5496	±	0.0050
openbookqa	0	acc	0.2360	±	0.0190
		acc_norm	0.3360	±	0.0211
piqa	0	acc	0.7285	±	0.0104
		acc_norm	0.7318	±	0.0103
rte	0	acc	0.5235	±	0.0301
truthfulqa_mc	1	mc1	0.2436	±	0.0150
		mc2	0.3791	±	0.0142
wic	0	acc	0.5000	±	0.0198
winogrande	0	acc	0.5675	±	0.0139
wsc	0	acc	0.3654	±	0.0474