ModernBERT-base-nli開源模型 - 支持零樣本分類與長上下文推理的自然語言幫手

首頁

Modernbert Base Nli

由tasksource開發

ModernBERT 是一個在多任務源的自然語言推理（NLI）任務上微調的模型，擅長零樣本分類和長上下文推理。

大型語言模型

Transformers

支持多種語言開源協議:Apache-2.0 #零樣本分類 #自然語言推理 #多任務微調

下載量 1,867

發布時間 : 12/20/2024

模型概述

該模型在多個NLI數據集上進行了微調，包括MNLI、ANLI等，擅長零樣本分類、情感分析和自然語言推理任務。

模型特點

多任務微調

在多個NLI數據集上進行微調，包括MNLI、ANLI等，提升了模型的泛化能力。

零樣本分類

擅長使用新標籤進行零樣本分類，適用於多種文本分類任務。

長上下文推理

能夠處理長上下文推理任務，表現優於同類模型。

情感分析

在情感分析任務上表現優異，準確率高。

模型能力

零樣本分類

自然語言推理

情感分析

長上下文推理

使用案例

文本分類

零樣本文本分類

使用新標籤對文本進行分類，無需額外訓練。

在多個數據集上表現優異，準確率高。

自然語言推理

矛盾/蘊含/中性分類

判斷兩個句子之間的關係是矛盾、蘊含還是中性。

在ANLI和FOLIO等數據集上優於同類模型。

情感分析

情感極性判斷

判斷文本的情感極性（正面/負面）。

在SST2等數據集上準確率高達96%。

🚀 Transformers - ModernBERT-base模型

ModernBERT-base模型是一個經過多任務微調的模型，在自然語言推理（NLI）任務上表現出色，可用於零樣本分類、情感分析等多種自然語言處理任務。

🚀 快速開始

環境準備

確保你已經安裝了transformers庫。如果尚未安裝，可以使用以下命令進行安裝：

pip install transformers

模型使用

[ZS] 零樣本分類管道

from transformers import pipeline
classifier = pipeline("zero-shot-classification",model="tasksource/ModernBERT-base-nli")

text = "one day I will see the world"
candidate_labels = ['travel', 'cooking', 'dancing']
classifier(text, candidate_labels)

此模型的NLI訓練數據包含 label-nli，這是一個專門為提升此類零樣本分類能力而構建的NLI數據集。

[NLI] 自然語言推理管道

from transformers import pipeline
pipe = pipeline("text-classification",model="tasksource/ModernBERT-base-nli")
pipe([dict(text='there is a cat',
  text_pair='there is a black cat')]) #list of (premise,hypothesis)

進一步微調的骨幹模型

此檢查點比基礎版本具有更強的推理和細粒度能力，可用於進一步的微調。

✨ 主要特性

多任務微調：在多個NLI任務上進行了微調，包括MNLI、ANLI、SICK等。
出色的推理能力：在推理任務上表現出色，優於llama 3.1 8B Instruct在ANLI和FOLIO上的表現。
長上下文推理：能夠處理長上下文的推理任務。
零樣本分類：可以進行新標籤的零樣本分類。

📦 安裝指南

使用pip安裝transformers庫：

pip install transformers

💻 使用示例

基礎用法

零樣本分類

from transformers import pipeline
classifier = pipeline("zero-shot-classification",model="tasksource/ModernBERT-base-nli")

text = "one day I will see the world"
candidate_labels = ['travel', 'cooking', 'dancing']
classifier(text, candidate_labels)

自然語言推理

from transformers import pipeline
pipe = pipeline("text-classification",model="tasksource/ModernBERT-base-nli")
pipe([dict(text='there is a cat',
  text_pair='there is a black cat')]) #list of (premise,hypothesis)

📚 詳細文檔

模型信息

屬性	詳情
庫名稱	transformers
基礎模型	answerdotai/ModernBERT-base
許可證	apache-2.0
語言	en
任務類型	零樣本分類
訓練數據集	nyu-mll/glue、facebook/anli等
標籤	instruct、natural-language-inference、nli、mnli等

模型測試準確率

測試名稱	測試準確率
glue/mnli	0.87
glue/qnli	0.93
glue/rte	0.85
...	...

模型訓練信息

該模型在Nvidia A30 GPU上訓練了200k步。

📄 許可證

本模型使用apache-2.0許可證。

📚 引用

如果你使用了此模型，請引用以下論文：

@inproceedings{sileo-2024-tasksource,
    title = "tasksource: A Large Collection of {NLP} tasks with a Structured Dataset Preprocessing Framework",
    author = "Sileo, Damien",
    booktitle = "Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024)",
    month = may,
    year = "2024",
    address = "Torino, Italia",
    publisher = "ELRA and ICCL",
    url = "https://aclanthology.org/2024.lrec-main.1361",
    pages = "15655--15684",
}