bert-mini-finetuned-qnli开源文本分类模型 - 免费使用精准完成文本分类任务

首页

Bert Mini Finetuned Qnli

由 M-FAC 开发

该模型是基于BERT-mini架构，在QNLI数据集上使用M-FAC二阶优化器进行微调的文本分类模型。

文本分类

Transformers

#二阶优化微调 #QNLI问答推理 #高效矩阵近似

下载量 11.93k

发布时间 : 3/2/2022

模型简介

该模型主要用于问答自然语言推理（QNLI）任务，通过M-FAC优化器实现高效微调，性能接近Adam优化器但具有理论优势。

模型特点

M-FAC二阶优化

采用先进的矩阵自由近似二阶优化方法，相比传统Adam优化器具有理论优势

轻量级架构

基于BERT-mini架构，模型参数较少但保持较好性能

稳健性能

在QNLI任务上表现稳定，五次运行标准差仅0.13

模型能力

文本分类

自然语言推理

问答系统支持

使用案例

教育

自动问答评估

用于评估学生答案与问题的逻辑一致性

在QNLI验证集上达到83.9%准确率

智能客服

问题相关性判断

判断用户提问与知识库答案的相关性

🚀 基于M - FAC微调的BERT - mini模型

本模型在QNLI数据集上使用了先进的二阶优化器M - FAC进行微调。有关M - FAC的更多详细信息，请查看NeurIPS 2021的论文：https://arxiv.org/pdf/2107.03356.pdf。

🚀 快速开始

✨ 主要特性

本模型基于BERT - mini，在QNLI数据集上使用M - FAC优化器进行微调。
与默认的Adam优化器进行了公平对比，微调框架一致，仅替换了优化器。

📦 安装指南

文档未提及具体安装步骤，可参考相关依赖库的安装方式，如Hugging Face的transformers库：

pip install transformers

💻 使用示例

基础用法

在https://github.com/huggingface/transformers/blob/master/examples/pytorch/text-classification/run_glue.py中添加M - FAC优化器代码，并运行以下脚本以复现结果：

CUDA_VISIBLE_DEVICES=0 python run_glue.py \
  --seed 8276 \
  --model_name_or_path prajjwal1/bert-mini \
  --task_name qnli \
  --do_train \
  --do_eval \
  --max_seq_length 128 \
  --per_device_train_batch_size 32 \
  --learning_rate 1e-4 \
  --num_train_epochs 5 \
  --output_dir out_dir/ \
  --optim MFAC \
  --optim_args '{"lr": 1e-4, "num_grads": 1024, "damp": 1e-6}'

📚 详细文档

微调设置

为了与默认的Adam基线进行公平比较，我们在https://github.com/huggingface/transformers/tree/master/examples/pytorch/text-classification所述的相同框架中微调模型，仅将Adam优化器替换为M - FAC。 M - FAC优化器使用的超参数如下：

learning rate = 1e-4
number of gradients = 1024
dampening = 1e-6

结果

我们分享了5次运行中表现最佳的模型，其在QNLI验证集上的得分如下：

accuracy = 83.90

在QNLI验证集上5次运行的均值和标准差如下：

优化器	准确率
Adam	83.85 ± 0.10
M - FAC	83.70 ± 0.13

我们认为，通过适度调整超参数per_device_train_batch_size、learning_rate、num_train_epochs、num_grads和damp，这些结果可以得到进一步提升。为了进行公平比较和建立稳健的默认设置，我们在所有模型（bert - tiny、bert - mini）和所有数据集（SQuAD版本2和GLUE）上使用了相同的超参数。

我们的M - FAC代码可在以下链接找到：https://github.com/IST-DASLab/M-FAC。关于如何在任何仓库中集成和使用M - FAC的分步教程可在以下链接找到：https://github.com/IST-DASLab/M-FAC/tree/master/tutorials。

📄 许可证

文档未提及许可证信息。

🔧 技术细节

文档未提供足够的技术实现细节。

BibTeX引用和引用信息

@article{frantar2021m,
  title={M-FAC: Efficient Matrix-Free Approximations of Second-Order Information},
  author={Frantar, Elias and Kurtic, Eldar and Alistarh, Dan},
  journal={Advances in Neural Information Processing Systems},
  volume={35},
  year={2021}
}