D

Deberta V3 Base

由microsoft開發
DeBERTaV3是基於DeBERTa改進的預訓練語言模型,通過梯度解耦嵌入共享的ELECTRA風格預訓練方法提升效率,在自然語言理解任務上表現優異。
下載量 1.6M
發布時間 : 3/2/2022

模型概述

DeBERTaV3通過解耦注意力機制和增強型掩碼解碼器改進BERT與RoBERTa模型,採用ELECTRA風格預訓練進一步提升性能,適用於多種自然語言理解任務。

模型特點

解耦注意力機制
通過分離內容和位置注意力計算,更精確地建模文本依賴關係
ELECTRA風格預訓練
採用梯度解耦嵌入共享的ELECTRA預訓練方法,提升訓練效率
增強型掩碼解碼器
改進的掩碼語言建模機制,增強模型對上下文的捕捉能力

模型能力

文本分類
問答系統
自然語言推理
語義理解

使用案例

文本理解
問答系統
用於構建高精度問答系統
在SQuAD 2.0上F1得分88.4,EM得分85.4
文本分類
用於自然語言推理任務
在MNLI任務上準確率達90.6/90.7(匹配/不匹配)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase