deberta-base-long-nli開源模型 - 支持自然語言推理與零樣本分類任務

首頁

Deberta Base Long Nli

由tasksource開發

基於DeBERTa-v3-base模型，上下文長度擴展至1280，並在tasksource數據集上進行了25萬步的微調，專注於自然語言推理和零樣本分類任務。

大型語言模型

Transformers

開源協議:Apache-2.0 #零樣本分類 #長文本推理 #多任務微調

下載量 541

發布時間 : 6/28/2024

模型概述

該模型在多項NLI任務上展現出強大的零樣本驗證性能，可用於基於蘊含關係的任意標籤零樣本分類、自然語言推理以及在新任務上的進一步微調。

模型特點

長文本處理能力

上下文長度擴展至1280，特別適合處理長文本NLI任務

多任務訓練

在tasksource的多樣化NLI數據集上進行訓練，涵蓋邏輯推理、事實核查等多種任務類型

強大的零樣本能力

在WNLI等任務上達到70%準確率，無需特定任務微調即可獲得良好表現

模型能力

零樣本分類

自然語言推理

邏輯推理

事實核查

文本蘊含判斷

使用案例

文本分類

零樣本情感分析

無需訓練即可對文本進行情感分類

在chatbot_arena_conversations數據集上達到72.2%準確率

邏輯推理

邏輯問題解答

解決需要邏輯推理的NLI問題

在FOLIO數據集上達到61.8%準確率

事實核查

文檔級事實核查

處理長文檔的事實核查任務

在doc-nli數據集上達到90%準確率

🚀 Deberta-v3-base零樣本分類模型

本模型基於deberta-v3-base，在tasksource上進行了25萬步的微調，在許多任務上展現出了強大的零樣本驗證性能。可用於零樣本基於蘊含關係的分類、自然語言推理以及在新任務或任務源任務上的進一步微調。

✨ 主要特性

多任務微調：基於deberta-v3-base，在眾多數據集上進行了微調，包括長文本自然語言推理任務、邏輯推理任務、事實驗證任務等。
強大的零樣本性能：在許多任務上有出色的零樣本驗證表現，如在WNLI上達到70%的準確率。
多種應用場景：可用於零樣本分類、自然語言推理、進一步微調等。

📦 安裝指南

使用本模型前，你需要安裝transformers和tasknet庫：

pip install transformers tasknet

💻 使用示例

基礎用法

[ZS] 零樣本分類管道

from transformers import pipeline
classifier = pipeline("zero-shot-classification",model="tasksource/deberta-base-long-nli")

text = "one day I will see the world"
candidate_labels = ['travel', 'cooking', 'dancing']
classifier(text, candidate_labels)

此模型的自然語言推理訓練數據包含label-nli，這是一個專門為提升此類零樣本分類性能而構建的自然語言推理數據集。

[NLI] 自然語言推理管道

from transformers import pipeline
pipe = pipeline("text-classification",model="tasksource/deberta-base-long-nli")
pipe([dict(text='there is a cat',
  text_pair='there is a black cat')]) #list of (premise,hypothesis)
# [{'label': 'neutral', 'score': 0.9952911138534546}]

高級用法

[TA] 任務源適配器：一鍵訪問數百個任務

# !pip install tasknet
import tasknet as tn
pipe = tn.load_pipeline('tasksource/deberta-base-long-nli','glue/sst2') # works for 500+ tasksource tasks
pipe(['That movie was great !', 'Awful movie.'])
# [{'label': 'positive', 'score': 0.9956}, {'label': 'negative', 'score': 0.9967}]

任務列表可在模型的config.json文件中查看。這種方式比零樣本分類更高效，因為每個示例只需要一次前向傳播，但靈活性較差。

[FT] 任務網絡：三行代碼實現微調

# !pip install tasknet
import tasknet as tn
hparams=dict(model_name='tasksource/deberta-base-long-nli', learning_rate=2e-5)
model, trainer = tn.Model_Trainer([tn.AutoTask("glue/rte")], hparams)
trainer.train()

📚 詳細文檔

模型信息

屬性	詳情
基礎模型	deberta-v3-base
訓練數據集	anli, nli_fever, FOLIO, ConTRoL-nli等眾多數據集
庫名稱	transformers
管道標籤	zero-shot-classification
標籤	text-classification, zero-shot-classification
許可證	apache-2.0

模型性能

數據集	準確率
anli/a1	63.3
anli/a2	47.2
anli/a3	49.4
nli_fever	79.4
FOLIO	61.8
ConTRoL-nli	63.3
cladder	71.1
zero-shot-label-nli	74.4
chatbot_arena_conversations	72.2
oasst2_pairwise_rlhf_reward	73.9
doc-nli	90.0

零樣本GPT - 4在FOLIO（邏輯推理）上得分為61%，在cladder（概率推理）上得分為62%，在ConTRoL（長文本自然語言推理）上得分為56.4%。

📄 許可證

本模型使用apache-2.0許可證。

📖 引用

更多詳細信息請參考文章：

@inproceedings{sileo-2024-tasksource,
    title = "tasksource: A Large Collection of {NLP} tasks with a Structured Dataset Preprocessing Framework",
    author = "Sileo, Damien",
    editor = "Calzolari, Nicoletta  and
      Kan, Min-Yen  and
      Hoste, Veronique  and
      Lenci, Alessandro  and
      Sakti, Sakriani  and
      Xue, Nianwen",
    booktitle = "Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024)",
    month = may,
    year = "2024",
    address = "Torino, Italia",
    publisher = "ELRA and ICCL",
    url = "https://aclanthology.org/2024.lrec-main.1361",
    pages = "15655--15684",
}