D

Deberta Large Mnli

由microsoft開發
DeBERTa-V2-XXLarge是基於解耦注意力機制和增強型掩碼解碼器的改進型BERT模型,在多項自然語言理解任務上表現優異。
下載量 1.4M
發布時間 : 3/2/2022

模型概述

DeBERTa通過解耦注意力機制和增強型掩碼解碼器改進了BERT與RoBERTa模型,在80GB訓練數據上訓練,在大多數自然語言理解任務上超越了BERT和RoBERTa的表現。

模型特點

解耦注意力機制
通過解耦注意力機制改進了傳統的自注意力機制,提升了模型性能。
增強型掩碼解碼器
採用增強型掩碼解碼器,進一步提升了模型在自然語言理解任務上的表現。
大規模訓練數據
使用80GB訓練數據進行訓練,覆蓋廣泛的自然語言理解場景。

模型能力

文本分類
問答系統
自然語言推理
語義相似度計算

使用案例

自然語言理解
文本分類
可用於情感分析、主題分類等文本分類任務。
在SST-2數據集上達到97.2%的準確率。
問答系統
可用於構建問答系統,回答用戶提出的問題。
在SQuAD 1.1數據集上達到96.1/91.4的F1/EM分數。
自然語言推理
可用於判斷兩個句子之間的邏輯關係。
在MNLI數據集上達到91.7/91.9的準確率。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase