bart-large-mnliオープンソースゼロサンプル分類モデル - 無料でデプロイして迅速なテキストカテゴリ判断を実現

ホーム

Bart Large Mnli

facebookによって開発

BART-largeアーキテクチャに基づき、MultiNLIデータセットでファインチューニングされたゼロショット分類モデル

大規模言語モデルオープンソースライセンス:MIT #ゼロショット分類 #マルチラベル推論 #NLIファインチューニング

ダウンロード数 3.7M

リリース時間 : 3/2/2022

モデル概要

このモデルはMultiNLIデータセットでファインチューニングされたBART-largeモデルで、ゼロショットテキスト分類タスク専用です。自然言語推論(NLI)の方法により、テキストを任意のカスタムカテゴリに分類できます。

モデル特徴

ゼロショット分類能力

ファインチューニング不要でテキストを任意のカスタムカテゴリに分類可能

NLIベースの柔軟な分類

仮説文を構築することでオープンエンドな分類を実現

マルチラベルサポート

テキスト内の複数の関連カテゴリを同時に識別可能

モデル能力

ゼロショットテキスト分類

自然言語推論

マルチラベル分類

使用事例

テキスト分類

ニュース分類

ニュースをカスタムテーマカテゴリに自動分類

サンプルで99%の精度を表示

コンテンツモデレーション

テキスト内容が属するセンシティブなカテゴリを識別

🚀 bart-large-mnli

このモデルは、MultiNLI (MNLI) データセットで学習された bart-large のチェックポイントです。自然言語処理におけるゼロショット分類タスクに利用できます。

🚀 クイックスタート

このモデルは、自然言語のゼロショット分類タスクに使用できます。以下に、このモデルの基本的な使い方を説明します。

✨ 主な機能

ゼロショット分類：事前学習されたNLIモデルを利用して、新しいクラスに対しても分類が可能です。
高い汎化性能：大規模な事前学習モデルであるBARTをベースとしているため、多くのケースで良好な性能を発揮します。

📦 インストール

このモデルを使用するには、transformers ライブラリが必要です。以下のコマンドでインストールできます。

pip install transformers

💻 使用例

基本的な使用法

zero-shot-classification パイプラインを使用して、文章を任意のクラスに分類できます。

from transformers import pipeline
classifier = pipeline("zero-shot-classification",
                      model="facebook/bart-large-mnli")

以下は、具体的な分類の例です。

sequence_to_classify = "one day I will see the world"
candidate_labels = ['travel', 'cooking', 'dancing']
classifier(sequence_to_classify, candidate_labels)
#{'labels': ['travel', 'dancing', 'cooking'],
# 'scores': [0.9938651323318481, 0.0032737774308770895, 0.002861034357920289],
# 'sequence': 'one day I will see the world'}

複数のラベルが正解となる場合には、multi_label=True を指定して各クラスを独立に計算できます。

candidate_labels = ['travel', 'cooking', 'dancing', 'exploration']
classifier(sequence_to_classify, candidate_labels, multi_label=True)
#{'labels': ['travel', 'exploration', 'dancing', 'cooking'],
# 'scores': [0.9945111274719238,
#  0.9383890628814697,
#  0.0057061901316046715,
#  0.0018193122232332826],
# 'sequence': 'one day I will see the world'}

高度な使用法

transformers と PyTorch を直接使用して、ゼロショット分類を行うこともできます。

# pose sequence as a NLI premise and label as a hypothesis
from transformers import AutoModelForSequenceClassification, AutoTokenizer
nli_model = AutoModelForSequenceClassification.from_pretrained('facebook/bart-large-mnli')
tokenizer = AutoTokenizer.from_pretrained('facebook/bart-large-mnli')

premise = sequence
hypothesis = f'This example is {label}.'

# run through model pre-trained on MNLI
x = tokenizer.encode(premise, hypothesis, return_tensors='pt',
                     truncation_strategy='only_first')
logits = nli_model(x.to(device))[0]

# we throw away "neutral" (dim 1) and take the probability of
# "entailment" (2) as the probability of the label being true 
entail_contradiction_logits = logits[:,[0,2]]
probs = entail_contradiction_logits.softmax(dim=1)
prob_label_is_true = probs[:,1]

📚 ドキュメント

🔧 技術詳細

Yin et al. は、事前学習されたNLIモデルをゼロショットシーケンス分類器として使用する方法を提案しました。この方法では、分類対象のシーケンスをNLIの前提とし、各候補ラベルから仮説を構築します。たとえば、シーケンスが「politics」クラスに属するかどうかを評価する場合、This text is about politics. という仮説を構築できます。その後、含意と矛盾の確率がラベルの確率に変換されます。

この方法は、多くのケースで驚くほど有効であり、特にBARTやRobertaのような大規模な事前学習モデルと併用すると効果的です。詳細な導入については、このブログ記事を参照してください。