🚀 MVP-multi-task
MVP-multi-task模型是由田一唐、李君毅、赵新伟和文继荣在MVP: 用于自然语言生成的多任务监督预训练中提出的。该模型能够适应多种自然语言生成任务,为自然语言处理领域提供了强大的支持。
🚀 快速开始
详细信息和说明可查看 https://github.com/RUCAIBox/MVP。
✨ 主要特性
模型描述
MVP-multi-task是一个基于提示的模型,它在MVP模型的基础上,进一步使用混合标注数据集对提示进行预训练。它是我们主要的 MVP 模型的一个变体(MVP+M),采用了带有逐层提示的Transformer编码器 - 解码器架构。
MVP专为自然语言生成而设计,可适应广泛的生成任务,包括但不限于摘要生成、数据到文本生成、开放式对话系统、故事生成、问答、问题生成、面向任务的对话系统、常识生成、释义生成、文本风格转换和文本简化。我们的模型也可适应自然语言理解任务,如序列分类和(抽取式)问答。
💻 使用示例
基础用法
摘要生成
>>> from transformers import MvpTokenizer, MvpForConditionalGeneration
>>> tokenizer = MvpTokenizer.from_pretrained("RUCAIBox/mvp")
>>> model = MvpForConditionalGeneration.from_pretrained("RUCAIBox/mvp-multi-task")
>>> inputs = tokenizer(
... "Summarize: You may want to stick it to your boss and leave your job, but don't do it if these are your reasons.",
... return_tensors="pt",
... )
>>> generated_ids = model.generate(**inputs)
>>> tokenizer.batch_decode(generated_ids, skip_special_tokens=True)
["Why You Shouldn't Quit Your Job"]
数据到文本生成
>>> from transformers import MvpTokenizerFast, MvpForConditionalGeneration
>>> tokenizer = MvpTokenizerFast.from_pretrained("RUCAIBox/mvp")
>>> model = MvpForConditionalGeneration.from_pretrained("RUCAIBox/mvp-multi-task")
>>> inputs = tokenizer(
... "Describe the following data: Iron Man | instance of | Superhero [SEP] Stan Lee | creator | Iron Man",
... return_tensors="pt",
... )
>>> generated_ids = model.generate(**inputs)
>>> tokenizer.batch_decode(generated_ids, skip_special_tokens=True)
['Iron Man is a fictional superhero appearing in American comic books published by Marvel Comics.']
📚 详细文档
相关模型
📄 许可证
本项目采用 Apache-2.0 许可证。
🔧 引用
@article{tang2022mvp,
title={MVP: Multi-task Supervised Pre-training for Natural Language Generation},
author={Tang, Tianyi and Li, Junyi and Zhao, Wayne Xin and Wen, Ji-Rong},
journal={arXiv preprint arXiv:2206.12131},
year={2022},
url={https://arxiv.org/abs/2206.12131},
}