MiniLM-L6-mnli-fever-docnli-ling-2cオープンソース推論モデル - 無料でデプロイでき、長文の推論に特化

ホーム

Minilm L6 Mnli Fever Docnli Ling 2c

MoritzLaurerによって開発

8つのNLIデータセットで学習された二項自然言語推論モデルで、長文推論タスクに優れています

テキスト分類

Transformers

英語#二項自然言語推論 #マルチデータセット学習 #長文処理

ダウンロード数 22

リリース時間 : 3/2/2022

モデル概要

このモデルは1,279,665の仮説-前提ペアで学習され、テキスト間の含意関係を判断するために特別に設計されており、長文処理能力が最適化されています

モデル特徴

マルチデータセット学習

8つのNLIデータセットを統合して学習し、様々なテキストタイプと推論シナリオをカバーしています

長文最適化

DocNLI学習データを含み、長文書の推論能力を特別に最適化しています

効率的な推論

MiniLM-L6軽量アーキテクチャを採用し、良好な性能を維持しながら高速推論を実現します

二項分類

従来の三分類NLIタスクを、より実用的な二項含意判断に簡略化しました

モデル能力

テキスト含意判断

ゼロショット分類

長文推論

使用事例

コンテンツ分析

映画レビュー感情検証

ユーザーレビュー内の具体的な記述が全体的な評価と一致しているか検証します

87%の矛盾記述を識別可能（サンプル推論に基づく）

ファクトチェック

声明検証

ニュース記事が特定の事実声明を支持しているか判断します

🚀 MiniLM-L6-mnli-fever-docnli-ling-2c

このモデルは、8つの自然言語推論（NLI）データセットから抽出された1,279,665組の仮説と前提のペアを使用して訓練され、長距離推論を学習することができます。

🚀 クイックスタート

このモデルは、8つの自然言語推論（NLI）データセットからの1,279,665組の仮説と前提のペアを使用して訓練されています。これは、非常に長いテキストを含むDocNLIを含む、モデルハブ内で唯一の8つのNLIデータセットで訓練されたモデルです。

✨ 主な機能

8つのNLIデータセットを使用して訓練され、長距離推論を学習できます。
バイナリNLIで訓練され、"entailment"または"not-entailment"を予測します。
ベースモデルはMicrosoftのMiniLM-L6で、高速ですが、他のモデルよりも精度がやや低いです。

📦 インストール

このモデルを使用するには、transformersライブラリが必要です。以下のコマンドでインストールできます。

pip install transformers torch

💻 使用例

基本的な使用法

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

model_name = "MoritzLaurer/MiniLM-L6-mnli-fever-docnli-ling-2c"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

premise = "I first thought that I liked the movie, but upon second thought it was actually disappointing."
hypothesis = "The movie was good."

input = tokenizer(premise, hypothesis, truncation=True, return_tensors="pt")
output = model(input["input_ids"].to(device))  # device = "cuda:0" or "cpu"
prediction = torch.softmax(output["logits"][0], -1).tolist()
label_names = ["entailment", "not_entailment"]
prediction = {name: round(float(pred) * 100, 1) for pred, name in zip(prediction, label_names)}
print(prediction)

📚 ドキュメント

モデルの説明

このモデルは、8つのNLIデータセットからの1,279,665組の仮説と前提のペアを使用して訓練されています。具体的には、MultiNLI、Fever-NLI、LingNLI、DocNLI（ANLI、QNLI、DUC、CNN/DailyMail、Curationを含む）です。

これは、DocNLIのような非常に長いテキストを含む8つのNLIデータセットで訓練された、モデルハブ内で唯一のモデルです。モデルは、"entailment"または"not-entailment"を予測するバイナリNLIで訓練されています。DocNLIは、"neural"と"contradiction"のクラスを"not-entailment"に統合して、より多くの訓練データを作成しています。

ベースモデルはMicrosoftのMiniLM-L6で、非常に高速ですが、他のモデルよりも精度がやや低いです。

想定される用途と制限

モデルの使用方法

上記のコード例を参照してください。

訓練データ

訓練手順

MiniLM-L6-mnli-fever-docnli-ling-2cは、以下のハイパーパラメータを使用してHugging Faceのトレーナーで訓練されました。

training_args = TrainingArguments(
    num_train_epochs=3,              # total number of training epochs
    learning_rate=2e-05,
    per_device_train_batch_size=32,   # batch size per device during training
    per_device_eval_batch_size=32,    # batch size for evaluation
    warmup_ratio=0.1,                # number of warmup steps for learning rate scheduler
    weight_decay=0.06,               # strength of weight decay
    fp16=True                        # mixed precision training
)