deberta-v3-small-finetuned-cola开源模型 - 免费部署助力语言学可接受性判断

首页

Deberta V3 Small Finetuned Cola

由 mrm8488 开发

该模型是在GLUE COLA数据集上对DeBERTa-v3-small进行微调的版本，用于语言学可接受性判断任务。

文本分类

Transformers

英语开源协议:MIT #语法检测 #高精度NLP #语言学分析

下载量 16

发布时间 : 3/2/2022

模型简介

该模型通过微调DeBERTa-v3-small在GLUE COLA数据集上，专门用于判断句子在语言学上的可接受性(语法性)。

模型特点

解耦注意力机制

采用DeBERTa特有的解耦注意力机制，改进了传统BERT模型的注意力计算方式

增强的掩码解码器

使用增强的掩码解码器技术，提高了模型对上下文的理解能力

高效的微调性能

在CoLA数据集上微调后取得了0.633的马修斯相关系数，表现出色

模型能力

语法正确性判断

语言学可接受性评估

文本分类

使用案例

教育技术

语法检查工具

用于开发英语语法检查工具，帮助学生识别语法错误

可准确判断句子的语法可接受性

自然语言处理研究

语言学可接受性基准测试

作为基准模型用于评估其他语法判断模型的性能

马修斯相关系数0.633，可作为强基线

🚀 DeBERTa-v3-small在CoLA上微调模型

该模型是microsoft/deberta-v3-small在GLUE COLA数据集上的微调版本，在评估集上取得了优异的效果，为自然语言理解任务提供了有力支持。

🚀 快速开始

此模型是 microsoft/deberta-v3-small 在GLUE COLA数据集上的微调版本。它在评估集上取得了以下结果：

损失率（Loss）：0.4051
马修斯相关系数（Matthews Correlation）：0.6333

📚 详细文档

模型描述

DeBERTa 通过解耦注意力和增强掩码解码器改进了BERT和RoBERTa模型。凭借这两项改进，DeBERTa在使用80GB训练数据的大多数自然语言理解（NLU）任务中优于RoBERTa。

更多详细信息和更新请查看官方仓库。

在 DeBERTa V3 中，我们在预训练阶段用ELECTRA提出的RTD（替换标记检测）目标取代了MLM目标，并在即将发表的论文中引入了一些创新。与DeBERTa-V2相比，我们的V3版本显著提高了模型在下游任务中的性能。你可以从我们原始论文的附录A11中找到关于该模型的简单介绍，我们将在单独的文章中提供更多细节。

DeBERTa V3小型模型有6层，隐藏层大小为768。由于我们使用了包含128K标记的词汇表，在嵌入层引入了9800万个参数，因此该模型的总参数数量为1.43亿。此模型与DeBERTa V2一样，使用160GB数据进行训练。