🚀 bart-lage-mnli-yahoo-answers
本模型基于facebook/bart-large-mnli在雅虎问答主题分类任务上进行微调。它可用于预测给定序列是否能分配某个主题标签,无论该标签是否曾见过。
你可以在这里体验此模型的零样本技术交互式演示,同时也能体验未微调的facebook/bart-large-mnli。
🚀 快速开始
本模型在主题分类任务上进行了微调,在零样本主题分类任务中表现最佳。使用hypothesis_template="This text is about {}."
,因为这是微调期间使用的模板。
对于主题分类以外的设置,你可以使用任何在MNLI上预训练的模型,如facebook/bart-large-mnli或roberta-large-mnli,代码如下。
💻 使用示例
基础用法
使用zero-shot-classification
管道调用模型:
from transformers import pipeline
nlp = pipeline("zero-shot-classification", model="joeddav/bart-large-mnli-yahoo-answers")
sequence_to_classify = "Who are you voting for in 2020?"
candidate_labels = ["Europe", "public health", "politics", "elections"]
hypothesis_template = "This text is about {}."
nlp(sequence_to_classify, candidate_labels, multi_class=True, hypothesis_template=hypothesis_template)
高级用法
手动使用PyTorch调用模型:
from transformers import BartForSequenceClassification, BartTokenizer
nli_model = BartForSequenceClassification.from_pretrained('joeddav/bart-large-mnli-yahoo-answers')
tokenizer = BartTokenizer.from_pretrained('joeddav/bart-large-mnli-yahoo-answers')
premise = sequence
hypothesis = f'This text is about {label}.'
x = tokenizer.encode(premise, hypothesis, return_tensors='pt',
max_length=tokenizer.max_len,
truncation_strategy='only_first')
logits = nli_model(x.to(device))[0]
entail_contradiction_logits = logits[:,[0,2]]
probs = entail_contradiction_logits.softmax(dim=1)
prob_label_is_true = probs[:,1]
🔧 技术细节
该模型是一个预训练的MNLI分类器,按照Yin等人2019年和这篇博客文章中最初描述的方式,在雅虎问答主题分类任务上进一步微调。即,将每个序列作为前提输入预训练的NLI模型,每个候选标签作为假设,格式如下:This text is about {class name}.
对于训练集中的每个示例,将一个真实标签假设和一个随机选择的错误标签假设输入模型,模型必须预测哪些标签有效,哪些标签错误。
由于该方法研究的是在一组不同标签上训练后对未见标签进行分类的能力,因此该模型仅在雅虎问答的10个标签中的5个上进行训练。这些标签是 “社会与文化”、“健康”、“计算机与互联网”、“商业与金融” 以及 “家庭与人际关系”。
📚 详细文档
评估结果
该模型使用_已见_和_未见_标签的标签加权F1值进行评估。即,对于每个示例,模型必须从10个语料库标签中进行预测。报告了训练期间已见标签和未见标签的F1值。我们发现未见标签和已见标签的F1分数分别为0.68和0.72。为了调整分布内和分布外标签,我们从_已见_标签的归一化概率中减去固定的30%,如Yin等人2019年和我们的博客文章中所述。
📄 许可证
本项目采用Apache-2.0许可证。
📦 模型信息
属性 |
详情 |
模型类型 |
基于facebook/bart-large-mnli微调的零样本分类模型 |
训练数据 |
雅虎问答数据集 |
适用任务 |
零样本主题分类 |