MiniLM-L6-mnli开源文本分类模型 - 快速推理实现高效文本分类

首页

Minilm L6 Mnli

由 MoritzLaurer 开发

基于MultiNLI数据集训练的快速推理文本分类模型，采用MiniLM-L6架构

文本分类

Transformers

英语#零样本推理 #快速文本分类 #多语言NLI

下载量 29

发布时间 : 3/2/2022

模型简介

该模型用于自然语言推理任务，能够判断两个句子之间的逻辑关系（蕴含/中立/矛盾）

模型特点

高效推理

采用MiniLM-L6轻量级架构，推理速度优于大型模型

多关系判断

可识别文本间的三种逻辑关系：蕴含、中立和矛盾

零样本分类

支持无需微调的直接分类应用

模型能力

文本分类

自然语言推理

零样本学习

使用案例

文本分析

影评情感分析

通过分析用户评论与标准评价的关系判断情感倾向

内容一致性检查

检测文档前后内容是否存在逻辑矛盾

🚀 MiniLM-L6-mnli

这是一个用于文本分类和零样本分类的模型，基于MiniLM-L6架构，在MultiNLI数据集上训练，速度快但精度略逊于其他模型。

🚀 快速开始

本模型可用于文本分类和零样本分类任务，以下是使用示例：

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

model_name = "MoritzLaurer/MiniLM-L6-mnli"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

premise = "I liked the movie"
hypothesis = "The movie was good."

input = tokenizer(premise, hypothesis, truncation=True, return_tensors="pt")
output = model(input["input_ids"].to(device))  # device = "cuda:0" or "cpu"
prediction = torch.softmax(output["logits"][0], -1).tolist()
label_names = ["entailment", "neutral", "contradiction"]
prediction = {name: round(float(pred) * 100, 1) for pred, name in zip(prediction, label_names)}
print(prediction)

✨ 主要特性

适用任务：适用于文本分类和零样本分类任务。
基础模型：基于微软的MiniLM-L6，速度快，但精度略低于其他模型。

📦 安装指南

文档未提及具体安装步骤，可参考Hugging Face相关库的安装方式来安装所需依赖。

💻 使用示例

基础用法

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

model_name = "MoritzLaurer/MiniLM-L6-mnli"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

premise = "I liked the movie"
hypothesis = "The movie was good."

input = tokenizer(premise, hypothesis, truncation=True, return_tensors="pt")
output = model(input["input_ids"].to(device))  # device = "cuda:0" or "cpu"
prediction = torch.softmax(output["logits"][0], -1).tolist()
label_names = ["entailment", "neutral", "contradiction"]
prediction = {name: round(float(pred) * 100, 1) for pred, name in zip(prediction, label_names)}
print(prediction)

📚 详细文档

训练数据

模型使用MultiNLI数据集进行训练。

训练过程

MiniLM-L6-mnli-binary使用Hugging Face的训练器进行训练，超参数如下：

training_args = TrainingArguments(
    num_train_epochs=5,              # total number of training epochs
    learning_rate=2e-05,
    per_device_train_batch_size=32,   # batch size per device during training
    per_device_eval_batch_size=32,    # batch size for evaluation
    warmup_ratio=0.1,                # number of warmup steps for learning rate scheduler
    weight_decay=0.06,               # strength of weight decay
    fp16=True                        # mixed precision training
)