1

1epochv3

由NDugar開發
DeBERTa是基於解耦注意力機制的增強型BERT模型,在多項自然語言理解任務上超越BERT和RoBERTa表現
下載量 28
發布時間 : 3/2/2022

模型概述

DeBERTa通過解耦注意力機制和增強型掩碼解碼器改進BERT架構,特別適用於自然語言理解任務。此版本為XXLarge規模,含15億參數

模型特點

解耦注意力機制
通過分離內容和位置注意力計算,提升模型對複雜語言結構的理解能力
增強型掩碼解碼器
改進的掩碼語言建模目標函數,更好地捕捉上下文依賴關係
大規模預訓練
使用160GB原始文本訓練,在多項基準測試中達到SOTA性能

模型能力

文本分類
自然語言推理
問答系統
語義相似度計算
句子對分類

使用案例

文本理解
情感分析
判斷文本情感傾向(如SST-2數據集)
97.2%準確率
自然語言推理
判斷句子對間的邏輯關係(MNLI任務)
91.7%/91.9%準確率(匹配/不匹配集)
問答系統
SQuAD問答
基於段落的問答任務
SQuAD 2.0達到92.2/89.7 (F1/EM)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase