ModernBERT-large-nli開源自然語言推理模型 - 零樣本分類及NLI任務表現出色

首頁

Modernbert Large Nli

由tasksource開發

基於ModernBERT-large模型，通過多任務微調優化的自然語言推理模型，在零樣本分類和NLI任務上表現優異。

大型語言模型

Transformers

支持多種語言開源協議:Apache-2.0 #零樣本分類 #自然語言推理 #多任務微調

下載量 61.52k

發布時間 : 1/4/2025

模型概述

該模型是基於多種自然語言推理任務進行多任務微調的ModernBERT模型，特別擅長零樣本分類、情感分析和長上下文推理。

模型特點

多任務微調

基於多種NLI任務（包括MNLI、ANLI、SICK等）進行多任務微調，提升了模型的泛化能力。

零樣本分類能力

在零樣本分類任務上表現優異，優於llama 3.1 8B Instruct等模型。

長上下文推理

擅長處理長上下文推理任務，在複雜邏輯推理場景中表現突出。

模型能力

自然語言推理

零樣本分類

情感分析

長上下文推理

邏輯推理

使用案例

文本分類

零樣本分類

無需特定訓練即可對新類別進行分類

在zero-shot-label-nli數據集上準確率達0.79

自然語言理解

文本蘊含判斷

判斷兩段文本之間的邏輯關係（蘊含/矛盾/中性）

在MNLI數據集上準確率達0.89

邏輯推理

複雜邏輯推理

處理需要多步推理的邏輯問題

在FOLIO數據集上準確率達0.71

🚀 ModernBERT-large 模型

ModernBERT-large 是一個經過多任務微調的模型，在自然語言推理、零樣本分類等任務中表現出色，具備強大的推理和細粒度分析能力。

🚀 快速開始

本模型是在多個自然語言推理（NLI）任務上進行多任務微調的 ModernBERT 模型，涵蓋了 MNLI、ANLI、SICK、WANLI、doc - nli、LingNLI、FOLIO、FOL - NLI、LogicNLI、Label - NLI 等任務（以及下表中的所有數據集）。這是一個 “指令” 版本的模型。該模型在 Nvidia A30 GPU 上訓練了 200k 步。

它在推理任務（在 ANLI 和 FOLIO 上表現優於 llama 3.1 8B Instruct）、長上下文推理、情感分析和使用新標籤的零樣本分類方面表現出色。

✨ 主要特性

強大的推理能力：在多種推理任務中表現優秀，優於部分同類模型。
長上下文處理：能夠處理長上下文的推理任務。
多任務適用性：適用於情感分析和零樣本分類等多種任務。

📚 詳細文檔

模型測試準確率

以下表格展示了模型的測試準確率。這些是同一個變壓器模型搭配不同分類頭的得分。通過在單一任務（如 SST）上進行微調可以進一步提高性能，但此檢查點在零樣本分類和自然語言推理（矛盾/蘊含/中立分類）方面表現出色。

測試名稱	測試準確率
glue/mnli	0.89
glue/qnli	0.96
glue/rte	0.91
glue/wnli	0.64
glue/mrpc	0.81
glue/qqp	0.87
glue/cola	0.87
glue/sst2	0.96
super_glue/boolq	0.66
super_glue/cb	0.86
super_glue/multirc	0.9
super_glue/wic	0.71
super_glue/axg	1
anli/a1	0.72
anli/a2	0.54
anli/a3	0.55
sick/label	0.91
sick/entailment_AB	0.93
snli	0.94
scitail/snli_format	0.95
hans	1
WANLI	0.77
recast/recast_ner	0.85
recast/recast_sentiment	0.97
recast/recast_verbnet	0.89
recast/recast_megaveridicality	0.87
recast/recast_verbcorner	0.87
recast/recast_kg_relations	0.9
recast/recast_factuality	0.95
recast/recast_puns	0.98
probability_words_nli/reasoning_1hop	1
probability_words_nli/usnli	0.79
probability_words_nli/reasoning_2hop	0.98
nan - nli	0.85
nli_fever	0.78
breaking_nli	0.99
conj_nli	0.72
fracas	0.79
dialogue_nli	0.94
mpe	0.75
dnc	0.91
recast_white/fnplus	0.76
recast_white/sprl	0.9
recast_white/dpr	0.84
add_one_rte	0.94
paws/labeled_final	0.96
pragmeval/pdtb	0.56
lex_glue/scotus	0.58
lex_glue/ledgar	0.85
dynasent/dynabench.dynasent.r1.all/r1	0.83
dynasent/dynabench.dynasent.r2.all/r2	0.76
cycic_classification	0.96
lingnli	0.91
monotonicity - entailment	0.97
scinli	0.88
naturallogic	0.93
dynahate	0.86
syntactic - augmentation - nli	0.94
autotnli	0.92
defeasible - nli/atomic	0.83
defeasible - nli/snli	0.8
help - nli	0.96
nli - veridicality - transitivity	0.99
lonli	0.99
dadc - limit - nli	0.79
folio	0.71
tomi - nli	0.54
puzzte	0.59
temporal - nli	0.93
counterfactually - augmented - snli	0.81
cnli	0.9
boolq - natural - perturbations	0.72
equate	0.65
logiqa - 2.0 - nli	0.58
mindgames	0.96
ConTRoL - nli	0.66
logical - fallacy	0.38
cladder	0.89
conceptrules_v2	1
zero - shot - label - nli	0.79
scone	1
monli	1
SpaceNLI	1
propsegment/nli	0.92
FLD.v2/default	0.91
FLD.v2/star	0.78
SDOH - NLI	0.99
scifact_entailment	0.87
feasibilityQA	0.79
AdjectiveScaleProbe - nli	1
resnli	1
semantic_fragments_nli	1
dataset_train_nli	0.95
nlgraph	0.97
ruletaker	0.99
PARARULE - Plus	1
logical - entailment	0.93
nope	0.56
LogicNLI	0.91
contract - nli/contractnli_a/seg	0.88
contract - nli/contractnli_b/full	0.84
nli4ct_semeval2024	0.72
biosift - nli	0.92
SIGA - nli	0.57
FOL - nli	0.79
doc - nli	0.81
mctest - nli	0.92
natural - language - satisfiability	0.92
idioms - nli	0.83
lifecycle - entailment	0.79
MSciNLI	0.84
hover - 3way/nli	0.92
seahorse_summarization_evaluation	0.81
missing - item - prediction/contrastive	0.88
Pol_NLI	0.93
synthetic - retrieval - NLI/count	0.72
synthetic - retrieval - NLI/position	0.9
synthetic - retrieval - NLI/binary	0.92
babi_nli	0.98

模型信息

屬性	詳情
庫名稱	transformers
基礎模型	answerdotai/ModernBERT - large
許可證	apache - 2.0
語言	英語
任務類型	零樣本分類
訓練數據集	nyu - mll/glue、facebook/anli
標籤	instruct、natural - language - inference、nli

💻 使用示例

基礎用法

[ZS] 零樣本分類管道

from transformers import pipeline
classifier = pipeline("zero-shot-classification",model="tasksource/ModernBERT-large-nli")

text = "one day I will see the world"
candidate_labels = ['travel', 'cooking', 'dancing']
classifier(text, candidate_labels)

此模型的 NLI 訓練數據包括 label - nli，這是一個專門為提高此類零樣本分類而構建的 NLI 數據集。

[NLI] 自然語言推理管道

from transformers import pipeline
pipe = pipeline("text-classification",model="tasksource/ModernBERT-large-nli")
pipe([dict(text='there is a cat',
  text_pair='there is a black cat')]) #list of (premise,hypothesis)

高級用法

進一步微調的骨幹模型

此檢查點比基礎版本具有更強的推理和細粒度分析能力，可用於進一步的微調。

📄 許可證

本模型使用 apache - 2.0 許可證。

📖 引用

@inproceedings{sileo-2024-tasksource,
    title = "tasksource: A Large Collection of {NLP} tasks with a Structured Dataset Preprocessing Framework",
    author = "Sileo, Damien",
    booktitle = "Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024)",
    month = may,
    year = "2024",
    address = "Torino, Italia",
    publisher = "ELRA and ICCL",
    url = "https://aclanthology.org/2024.lrec-main.1361",
    pages = "15655--15684",
}