MiniLM-L6-mnliオープンソーステキスト分類モデル - 高速推論による効率的なテキスト分類の実現

ホーム

Minilm L6 Mnli

MoritzLaurerによって開発

MultiNLIデータセットを基に訓練された高速推論テキスト分類モデルで、MiniLM-L6アーキテクチャを採用しています。

テキスト分類

Transformers

英語#ゼロショット推論 #高速テキスト分類 #多言語NLI

ダウンロード数 29

リリース時間 : 3/2/2022

モデル概要

このモデルは自然言語推論タスクに使用され、2つの文間の論理関係（含意/中立/矛盾）を判断することができます。

モデル特徴

高効率推論

MiniLM-L6の軽量アーキテクチャを採用しており、推論速度は大型モデルよりも優れています。

多関係判断

テキスト間の3種類の論理関係（含意、中立、矛盾）を識別することができます。

ゼロショット分類

微調整なしで直接分類アプリケーションをサポートします。

モデル能力

テキスト分類

自然言語推論

ゼロショット学習

使用事例

テキスト分析

映画レビューの感情分析

ユーザーのレビューと標準評価の関係を分析することで感情傾向を判断します。

内容の一貫性チェック

文書の前後の内容に論理的な矛盾があるかどうかを検出します。

🚀 MiniLM-L6-mnli

このモデルは、テキスト分類やゼロショット分類に特化しており、精度を指標として評価されます。高速な推論が可能で、特定のタスクにおいて有効です。

🚀 クイックスタート

このセクションでは、MiniLM-L6-mnliモデルの基本的な使い方を説明します。

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

model_name = "MoritzLaurer/MiniLM-L6-mnli"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

premise = "I liked the movie"
hypothesis = "The movie was good."

input = tokenizer(premise, hypothesis, truncation=True, return_tensors="pt")
output = model(input["input_ids"].to(device))  # device = "cuda:0" or "cpu"
prediction = torch.softmax(output["logits"][0], -1).tolist()
label_names = ["entailment", "neutral", "contradiction"]
prediction = {name: round(float(pred) * 100, 1) for pred, name in zip(prediction, label_names)}
print(prediction)

✨ 主な機能

このモデルは、MultiNLIデータセットで学習されています。
ベースモデルはMicrosoftのMiniLM-L6で、非常に高速ですが、他のモデルよりも精度がやや低いです。

📦 インストール

このモデルを使用するには、transformersライブラリが必要です。以下のコマンドでインストールできます。

pip install transformers torch

💻 使用例

基本的な使用法

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

model_name = "MoritzLaurer/MiniLM-L6-mnli"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

premise = "I liked the movie"
hypothesis = "The movie was good."

input = tokenizer(premise, hypothesis, truncation=True, return_tensors="pt")
output = model(input["input_ids"].to(device))  # device = "cuda:0" or "cpu"
prediction = torch.softmax(output["logits"][0], -1).tolist()
label_names = ["entailment", "neutral", "contradiction"]
prediction = {name: round(float(pred) * 100, 1) for pred, name in zip(prediction, label_names)}
print(prediction)

📚 ドキュメント

学習データ

MultiNLIデータセットを使用して学習されています。

学習手順

MiniLM-L6-mnli-binaryは、Hugging Faceのトレーナーを使用して、以下のハイパーパラメータで学習されました。

training_args = TrainingArguments(
    num_train_epochs=5,              # total number of training epochs
    learning_rate=2e-05,
    per_device_train_batch_size=32,   # batch size per device during training
    per_device_eval_batch_size=32,    # batch size for evaluation
    warmup_ratio=0.1,                # number of warmup steps for learning rate scheduler
    weight_decay=0.06,               # strength of weight decay
    fp16=True                        # mixed precision training
)