D

Deberta V3 Xsmall Squad2

Developed by nbroad
DeBERTa v3 xsmall是微軟推出的改進版自然語言理解模型,通過解耦注意力機制和增強型掩碼解碼器提升性能,在多項NLU任務上超越RoBERTa。
Downloads 17
Release Time : 3/2/2022

Model Overview

DeBERTa v3 xsmall是基於DeBERTa架構的改進版本,採用ELECTRA風格的梯度解耦嵌入共享預訓練方法,顯著提升了下游任務性能。主要用於問答系統等自然語言理解任務。

Model Features

解耦注意力機制
改進BERT與RoBERTa的注意力機制,提升模型理解能力
增強型掩碼解碼器
優化語言模型訓練過程,提高預測準確性
ELECTRA風格預訓練
V3版本採用梯度解耦嵌入共享方法,提升訓練效率

Model Capabilities

自然語言理解
問答系統
文本理解
上下文分析

Use Cases

問答系統
SQuAD2.0問答任務
在SQuAD2.0數據集上進行問答任務
F1值81.5,精確匹配78.3
自然語言處理
文本理解
理解複雜文本內容並提取關鍵信息
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase