scandi - nli - base开源自然语言推理模型，免费支持丹挪瑞三种语言推理

首页

Scandi Nli Base

由 alexandrainst 开发

基于NbAiLab/nb-bert-base微调的自然语言推理模型，支持丹麦语、挪威博克马尔语和瑞典语

文本分类

Transformers

其他开源协议:Apache-2.0 #斯堪的纳维亚多语言 #零样本分类 #自然语言推理

下载量 19

发布时间 : 11/28/2022

模型简介

这是一个专门针对斯堪的纳维亚语言的自然语言推理模型，可用于零样本分类任务，支持丹麦语、挪威博克马尔语和瑞典语。

模型特点

多语言支持

专门针对斯堪的纳维亚语言(丹麦语、挪威博克马尔语和瑞典语)优化

零样本分类能力

无需特定任务训练即可进行分类任务

系列模型选择

提供从小型到大型不同规模的模型版本以满足不同需求

模型能力

零样本文本分类

多语言自然语言推理

斯堪的纳维亚语言处理

使用案例

新闻分类

体育新闻分类

自动识别体育相关新闻内容

在体育类别上准确率72.4%

政治新闻分类

识别政治相关新闻内容

在政治类别上准确率69.5%

医疗文本分析

医疗研究分类

识别医疗健康相关研究内容

在健康类别上准确率88.5%

🚀 ScandiNLI - 斯堪的纳维亚语言自然语言推理模型

ScandiNLI 是一款针对丹麦语、挪威书面语和瑞典语进行自然语言推理的模型。它基于 NbAiLab/nb - bert - base 微调而来，为斯堪的纳维亚语言的自然语言推理任务提供了强大支持。我们发布了三种不同规模的斯堪的纳维亚自然语言推理（NLI）模型，以满足不同场景的需求。

🚀 快速开始

你可以在脚本中按如下方式使用该模型：

基础用法

>>> from transformers import pipeline
>>> classifier = pipeline(
...     "zero-shot-classification",
...     model="alexandrainst/scandi-nli-base",
... )
>>> classifier(
...     "Mexicansk bokser advarer Messi - 'Du skal bede til gud, om at jeg ikke finder dig'",
...     candidate_labels=['sundhed', 'politik', 'sport', 'religion'],
...     hypothesis_template="Dette eksempel handler om {}",
... )
{'sequence': "Mexicansk bokser advarer Messi - 'Du skal bede til gud, om at jeg ikke finder dig'",
 'labels': ['sport', 'religion', 'sundhed', 'politik'],
 'scores': [0.724335789680481,
  0.1176532730460167,
  0.08848614990711212,
  0.06952482461929321]}

✨ 主要特性

多语言支持：支持丹麦语、挪威书面语和瑞典语三种斯堪的纳维亚语言的自然语言推理。
多模型选择：提供了不同规模的模型，包括 alexandrainst/scandi - nli - large - v2、alexandrainst/scandi - nli - large、alexandrainst/scandi - nli - base 和 alexandrainst/scandi - nli - small，可根据实际需求选择。

📚 详细文档

性能表现

我们分别对丹麦语、瑞典语和挪威书面语的模型进行了评估，报告了马修斯相关系数（MCC）、宏平均 F1 分数以及准确率。

斯堪的纳维亚综合评估

斯堪的纳维亚综合分数是丹麦语、瑞典语和挪威语分数的平均值。

模型	MCC	宏平均 F1 分数	准确率	参数数量
`alexandrainst/scandi-nli-large-v2`	75.42%	75.41%	84.95%	3.54 亿
`alexandrainst/scandi-nli-large`	73.70%	74.44%	83.91%	3.54 亿
`MoritzLaurer/mDeBERTa-v3-base-xnli-multilingual-nli-2mil7`	69.01%	71.99%	80.66%	2.79 亿
`alexandrainst/scandi-nli-base`（本模型）	67.42%	71.54%	80.09%	1.78 亿
`joeddav/xlm-roberta-large-xnli`	64.17%	70.80%	77.29%	5.6 亿
`MoritzLaurer/mDeBERTa-v3-base-mnli-xnli`	63.94%	70.41%	77.23%	2.79 亿
`NbAiLab/nb-bert-base-mnli`	61.71%	68.36%	76.08%	1.78 亿
`alexandrainst/scandi-nli-small`	56.02%	65.30%	73.56%	2200 万

丹麦语评估

我们使用 DanFEVER 数据集的测试集来评估模型在丹麦语上的性能。测试集使用此代码片段生成。

模型	MCC	宏平均 F1 分数	准确率	参数数量
`alexandrainst/scandi-nli-large-v2`	75.65%	59.23%	87.89%	3.54 亿
`alexandrainst/scandi-nli-large`	73.80%	58.41%	86.98%	3.54 亿
`MoritzLaurer/mDeBERTa-v3-base-xnli-multilingual-nli-2mil7`	68.37%	57.10%	83.25%	2.79 亿
`alexandrainst/scandi-nli-base`（本模型）	62.44%	55.00%	80.42%	1.78 亿
`NbAiLab/nb-bert-base-mnli`	56.92%	53.25%	76.39%	1.78 亿
`MoritzLaurer/mDeBERTa-v3-base-mnli-xnli`	52.79%	52.00%	72.35%	2.79 亿
`joeddav/xlm-roberta-large-xnli`	49.18%	50.31%	69.73%	5.6 亿
`alexandrainst/scandi-nli-small`	47.28%	48.88%	73.46%	2200 万

瑞典语评估

我们使用 MultiNLI 数据集机器翻译版本的测试集来评估模型在瑞典语上的性能。我们承认在非黄金标准数据集上进行评估并不理想，但目前没有已知的瑞典语 NLI 数据集。

模型	MCC	宏平均 F1 分数	准确率	参数数量
`alexandrainst/scandi-nli-large-v2`	79.02%	85.99%	85.99%	3.54 亿
`alexandrainst/scandi-nli-large`	76.69%	84.47%	84.38%	3.54 亿
`joeddav/xlm-roberta-large-xnli`	75.35%	83.42%	83.55%	5.6 亿
`MoritzLaurer/mDeBERTa-v3-base-mnli-xnli`	73.84%	82.46%	82.58%	2.79 亿
`MoritzLaurer/mDeBERTa-v3-base-xnli-multilingual-nli-2mil7`	73.32%	82.15%	82.08%	2.79 亿
`alexandrainst/scandi-nli-base`（本模型）	72.29%	81.37%	81.51%	1.78 亿
`NbAiLab/nb-bert-base-mnli`	64.69%	76.40%	76.47%	1.78 亿
`alexandrainst/scandi-nli-small`	62.35%	74.79%	74.93%	2200 万

挪威语评估

我们使用 MultiNLI 数据集机器翻译版本的测试集来评估模型在挪威语上的性能。同样，我们承认在非黄金标准数据集上进行评估并不理想，但目前没有已知的挪威语 NLI 数据集。

模型	MCC	宏平均 F1 分数	准确率	参数数量
`alexandrainst/scandi-nli-large-v2`	71.59%	81.00%	80.96%	3.54 亿
`alexandrainst/scandi-nli-large`	70.61%	80.43%	80.36%	3.54 亿
`joeddav/xlm-roberta-large-xnli`	67.99%	78.68%	78.60%	5.6 亿
`alexandrainst/scandi-nli-base`（本模型）	67.53%	78.24%	78.33%	1.78 亿
`MoritzLaurer/mDeBERTa-v3-base-xnli-multilingual-nli-2mil7`	65.33%	76.73%	76.65%	2.79 亿
`MoritzLaurer/mDeBERTa-v3-base-mnli-xnli`	65.18%	76.76%	76.77%	2.79 亿
`NbAiLab/nb-bert-base-mnli`	63.51%	75.42%	75.39%	1.78 亿
`alexandrainst/scandi-nli-small`	58.42%	72.22%	72.30%	2200 万

训练过程

该模型在由 DanFEVER 以及 MultiNLI 和 CommitmentBank 的三种语言机器翻译版本，还有 FEVER 和 Adversarial NLI 的瑞典语机器翻译版本组成的数据集上进行了微调。

DanFEVER 的训练集使用此代码片段生成。在训练过程中，三种语言被等比例采样，并在 DanFEVER 的验证集以及瑞典语和挪威书面语的 MultiNLI 机器翻译版本的验证集上进行验证，验证集也采用等比例采样。

你可以查看 Github 仓库获取训练 ScandiNLI 模型的代码，完整的训练日志可在此 Weights and Biases 报告中找到。

训练超参数

训练过程中使用了以下超参数：

学习率：2e - 05
训练批次大小：8
评估批次大小：8
随机种子：4242
梯度累积步数：2
总训练批次大小：32
优化器：Adam，β1 = 0.9，β2 = 0.999，ε = 1e - 08
学习率调度器类型：线性
学习率调度器热身步数：500
最大步数：50000

🔧 技术细节

模型基础信息

属性	详情
模型类型	自然语言推理模型
训练数据	DanFEVER、MultiNLI、CommitmentBank、FEVER 和 Adversarial NLI 的机器翻译版本
基础模型	NbAiLab/nb - bert - base

推理参数

推理时使用的假设模板为：Dette eksempel handler om {}

示例展示

模型提供了不同语言的推理示例：

丹麦语示例：
- 文本：Mexicansk bokser advarer Messi - 'Du skal bede til gud, om at jeg ikke finder dig'
- 候选标签：sundhed, politik, sport, religion
挪威语示例：
- 文本：Regjeringen i Russland hevder Norge fører en politikk som vil føre til opptrapping i Arktis og «den endelige ødeleggelsen av russisk - norske relasjoner».
- 候选标签：helse, politikk, sport, religion
瑞典语示例：
- 文本：Så luras kroppens immunförsvar att bota cancer
- 候选标签：hälsa, politik, sport, religion