ModernBERT-large-nliオープンソース自然言語推論モデル - ゼロショット分類とNLIタスクで優れた性能を発揮

ホーム

Modernbert Large Nli

tasksourceによって開発

ModernBERT-largeモデルをベースに、マルチタスクファインチューニングで最適化された自然言語推論モデルで、ゼロショット分類とNLIタスクで優れた性能を発揮します。

大規模言語モデル

Transformers

複数言語対応オープンソースライセンス:Apache-2.0 #ゼロショット分類 #自然言語推論 #マルチタスクファインチューニング

ダウンロード数 61.52k

リリース時間 : 1/4/2025

モデル概要

このモデルは、さまざまな自然言語推論タスクでマルチタスクファインチューニングされたModernBERTモデルで、特にゼロショット分類、感情分析、長文脈推論に優れています。

モデル特徴

マルチタスクファインチューニング

MNLI、ANLI、SICKなどの複数のNLIタスクに基づいてマルチタスクファインチューニングを行い、モデルの汎化能力を向上させました。

ゼロショット分類能力

ゼロショット分類タスクで優れた性能を発揮し、llama 3.1 8B Instructなどのモデルを上回ります。

長文脈推論

長文脈推論タスクの処理に優れており、複雑な論理推論シナリオで顕著な性能を発揮します。

モデル能力

自然言語推論

ゼロショット分類

感情分析

長文脈推論

論理推論

使用事例

テキスト分類

ゼロショット分類

特定のトレーニングなしで新しいカテゴリに分類可能

zero-shot-label-nliデータセットで精度0.79を達成

自然言語理解

テキスト含意判断

2つのテキスト間の論理関係（含意/矛盾/中立）を判断

MNLIデータセットで精度0.89を達成

論理推論

複雑な論理推論

多段階の推論を必要とする論理問題を処理

FOLIOデータセットで精度0.71を達成

🚀 ModernBERT-large-nliモデル

このモデルは、自然言語推論（NLI）タスクに特化した高性能なモデルです。多様なNLIタスクに対してマルチタスク微調整が行われており、推論タスクやゼロショット分類などの様々な自然言語処理タスクで優れた性能を発揮します。

🚀 クイックスタート

このモデルは、MNLI、ANLI、SICKなどの様々なNLIタスクでマルチタスク微調整されたModernBERTモデルです。「instruct」バージョンに相当し、Nvidia A30 GPUで20万ステップの学習を行っています。推論タスクや長文脈推論、センチメント分析、新しいラベルによるゼロショット分類などで優れた性能を発揮します。

✨ 主な機能

高度な推論能力：ANLIやFOLIOなどのタスクで、llama 3.1 8B Instructよりも優れた性能を発揮します。
長文脈推論：長い文脈に対する推論が可能です。
センチメント分析：文章のセンチメントを高精度に分析します。
ゼロショット分類：新しいラベルに対するゼロショット分類が可能です。

📦 インストール

このモデルはtransformersライブラリを使用して利用できます。以下のコマンドでインストールできます。

pip install transformers

💻 使用例

基本的な使用法

[ZS] ゼロショット分類パイプライン

from transformers import pipeline
classifier = pipeline("zero-shot-classification",model="tasksource/ModernBERT-large-nli")

text = "one day I will see the world"
candidate_labels = ['travel', 'cooking', 'dancing']
classifier(text, candidate_labels)

このモデルのNLI学習データには、label-nliが含まれており、このようなゼロショット分類の性能向上に役立っています。

[NLI] 自然言語推論パイプライン

from transformers import pipeline
pipe = pipeline("text-classification",model="tasksource/ModernBERT-large-nli")
pipe([dict(text='there is a cat',
  text_pair='there is a black cat')]) #list of (premise,hypothesis)

高度な使用法

このチェックポイントは、ベースバージョンよりも強力な推論能力と細粒度な能力を持っており、さらなる微調整に使用することができます。

📚 ドキュメント

モデル情報

プロパティ	詳細
ライブラリ名	transformers
ベースモデル	answerdotai/ModernBERT-large
ライセンス	apache-2.0
言語	en
パイプラインタグ	zero-shot-classification
データセット	nyu-mll/glue、facebook/anli
タグ	instruct、natural-language-inference、nli

モデルのテスト精度

テスト名	テスト精度
glue/mnli	0.89
glue/qnli	0.96
glue/rte	0.91
...（省略）	...
scone	1
monli	1
SpaceNLI	1

📄 ライセンス

このモデルは、Apache 2.0ライセンスの下で公開されています。

📚 引用

@inproceedings{sileo-2024-tasksource,
    title = "tasksource: A Large Collection of {NLP} tasks with a Structured Dataset Preprocessing Framework",
    author = "Sileo, Damien",
    booktitle = "Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024)",
    month = may,
    year = "2024",
    address = "Torino, Italia",
    publisher = "ELRA and ICCL",
    url = "https://aclanthology.org/2024.lrec-main.1361",
    pages = "15655--15684",
}