开源MVP多任务模型 - 专为多种自然语言生成任务设计，优化效果显著

首页

Mvp Multi Task

由 RUCAIBox 开发

MVP多任务模型是基于提示词的预训练模型，通过混合标注数据集优化，专为多种自然语言生成任务设计。

大型语言模型

Transformers

支持多种语言开源协议:Apache-2.0 #多任务生成 #提示词优化 #分层Transformer

下载量 20

发布时间 : 6/2/2022

模型简介

MVP多任务模型采用Transformer编码器-解码器架构，支持摘要生成、对话系统、故事生成等多种自然语言生成任务，同时也可用于自然语言理解任务。

模型特点

多任务支持

支持多种自然语言生成任务，包括摘要生成、对话系统、故事生成等。

提示词优化

采用带有分层提示词的架构，提升模型在不同任务上的表现。

广泛适用性

不仅适用于生成任务，还可用于自然语言理解任务，如序列分类和抽取式问答。

模型能力

文本生成

文本到文本生成

摘要生成

对话系统

数据到文本生成

故事生成

问答系统

问题生成

任务导向对话系统

常识生成

文本复述

文本风格转换

文本简化

序列分类

抽取式问答

使用案例

摘要生成

摘要生成示例

生成文本的简短摘要。

为什么你不该辞职的理由

数据到文本生成

数据到文本生成示例

将结构化数据转换为自然语言描述。

钢铁侠是由漫威漫画出版的美国漫画中的虚构超级英雄角色。

对话系统

对话系统示例

生成对话回复。

故事生成

故事生成示例

根据标题生成故事。

问答系统

问答系统示例

回答给定的问题。

问题生成

问题生成示例

根据答案生成问题。

🚀 MVP-multi-task

MVP-multi-task模型是由田一唐、李君毅、赵新伟和文继荣在MVP: 用于自然语言生成的多任务监督预训练中提出的。该模型能够适应多种自然语言生成任务，为自然语言处理领域提供了强大的支持。

🚀 快速开始

详细信息和说明可查看 https://github.com/RUCAIBox/MVP。

✨ 主要特性

模型描述

MVP-multi-task是一个基于提示的模型，它在MVP模型的基础上，进一步使用混合标注数据集对提示进行预训练。它是我们主要的 MVP 模型的一个变体（MVP+M），采用了带有逐层提示的Transformer编码器 - 解码器架构。

MVP专为自然语言生成而设计，可适应广泛的生成任务，包括但不限于摘要生成、数据到文本生成、开放式对话系统、故事生成、问答、问题生成、面向任务的对话系统、常识生成、释义生成、文本风格转换和文本简化。我们的模型也可适应自然语言理解任务，如序列分类和（抽取式）问答。

💻 使用示例

基础用法

摘要生成

>>> from transformers import MvpTokenizer, MvpForConditionalGeneration

>>> tokenizer = MvpTokenizer.from_pretrained("RUCAIBox/mvp")
>>> model = MvpForConditionalGeneration.from_pretrained("RUCAIBox/mvp-multi-task")

>>> inputs = tokenizer(
...     "Summarize: You may want to stick it to your boss and leave your job, but don't do it if these are your reasons.",
...     return_tensors="pt",
... )
>>> generated_ids = model.generate(**inputs)
>>> tokenizer.batch_decode(generated_ids, skip_special_tokens=True)
["Why You Shouldn't Quit Your Job"]

数据到文本生成

>>> from transformers import MvpTokenizerFast, MvpForConditionalGeneration

>>> tokenizer = MvpTokenizerFast.from_pretrained("RUCAIBox/mvp")
>>> model = MvpForConditionalGeneration.from_pretrained("RUCAIBox/mvp-multi-task")

>>> inputs = tokenizer(
...     "Describe the following data: Iron Man | instance of | Superhero [SEP] Stan Lee | creator | Iron Man",
...     return_tensors="pt",
... )
>>> generated_ids = model.generate(**inputs)
>>> tokenizer.batch_decode(generated_ids, skip_special_tokens=True)
['Iron Man is a fictional superhero appearing in American comic books published by Marvel Comics.']

📚 详细文档

📄 许可证

本项目采用 Apache-2.0 许可证。

🔧 引用

@article{tang2022mvp,
  title={MVP: Multi-task Supervised Pre-training for Natural Language Generation},
  author={Tang, Tianyi and Li, Junyi and Zhao, Wayne Xin and Wen, Ji-Rong},
  journal={arXiv preprint arXiv:2206.12131},
  year={2022},
  url={https://arxiv.org/abs/2206.12131},
}