Erlangshen DeBERTa V2 97M Chinese
Apache-2.0
擅長處理自然語言理解任務的中文DeBERTa-v2基礎模型,採用全詞掩碼技術,參數量9700萬。
大型語言模型
Transformers 中文

E
IDEA-CCNL
178
11
Deberta V2 Xxlarge Mnli
MIT
DeBERTa V2 XXLarge是基於解耦注意力機制的增強型BERT變體,在自然語言理解任務上超越RoBERTa和XLNet,參數量達15億
大型語言模型
Transformers 英語

D
microsoft
4,077
8
Deberta Base
MIT
DeBERTa 是一種基於解耦注意力機制的增強型 BERT 解碼模型,改進了 BERT 和 RoBERTa 模型,在自然語言理解任務中表現優異。
大型語言模型
Transformers 英語

D
kamalkraj
287
0
Deberta V2 Xlarge
MIT
DeBERTa V2 XXLarge是微軟推出的增強型自然語言理解模型,通過解耦注意力機制和增強型掩碼解碼器改進BERT架構,在多項NLP任務上達到SOTA性能。
大型語言模型
Transformers 英語

D
microsoft
116.71k
22
Deberta V2 Xlarge Mnli
MIT
DeBERTa V2 XLarge是微軟推出的增強型自然語言理解模型,通過解耦注意力機制和增強型掩碼解碼器改進BERT架構,在多項NLU任務上超越BERT和RoBERTa的表現。
大型語言模型
Transformers 英語

D
microsoft
51.59k
9
Deberta Base Mnli
MIT
基於解耦注意力機制的增強型BERT解碼模型,在MNLI任務上微調
大型語言模型 英語
D
microsoft
96.92k
6
Deberta V2 Xxlarge
MIT
DeBERTa V2 XXLarge是基於解耦注意力與增強掩碼解碼的改進型BERT模型,具有15億參數,在多項自然語言理解任務上超越BERT和RoBERTa表現
大型語言模型
Transformers 英語

D
microsoft
9,179
33
Deberta V3 Small
MIT
DeBERTa-v3是微軟推出的改進版自然語言理解模型,通過ELECTRA風格預訓練和梯度解耦嵌入共享技術優化,在保持較小參數量的同時實現高效性能。
大型語言模型
Transformers 英語

D
microsoft
189.23k
51
Deberta Xlarge Mnli
MIT
DeBERTa-XLarge-MNLI是基於解耦注意力機制的增強型BERT模型,經過MNLI任務微調,擁有750M參數,在自然語言理解任務上表現優異。
大型語言模型
Transformers 英語

D
microsoft
833.58k
19
Deberta Xlarge
MIT
DeBERTa通過解耦注意力機制和增強型掩碼解碼器改進了BERT與RoBERTa模型,在多數自然語言理解任務上表現優異。
大型語言模型
Transformers 英語

D
microsoft
312
2
Deberta V2 Xlarge
MIT
DeBERTa是基於解耦注意力機制的增強型BERT解碼模型,通過改進的注意力機制和增強型掩碼解碼器,在多項自然語言理解任務上超越BERT和RoBERTa的表現。
大型語言模型
Transformers 英語

D
kamalkraj
302
0
Deberta Base
MIT
DeBERTa是基於解耦注意力機制和增強型掩碼解碼器改進的BERT模型,在多項自然語言理解任務上表現優異。
大型語言模型 英語
D
microsoft
298.78k
78
Deberta V3 Xsmall
MIT
DeBERTaV3是微軟提出的改進版DeBERTa模型,通過ELECTRA風格的梯度解耦嵌入共享預訓練方法提升效率,在自然語言理解任務中表現優異。
大型語言模型
Transformers 英語

D
microsoft
87.40k
43
Deberta Large
MIT
DeBERTa是一種改進的BERT模型,通過解耦注意力機制和增強型掩碼解碼器提升性能,在多項自然語言理解任務上超越BERT和RoBERTa。
大型語言模型
Transformers 英語

D
microsoft
15.07k
16
Deberta V3 Large Mnli
基於MultiNLI數據集訓練的DeBERTa-v3-large模型,用於文本蘊含關係判斷
文本分類
Transformers 英語

D
khalidalt
150
5
Deberta V3 Small Finetuned Mnli
MIT
在GLUE MNLI數據集上微調的DeBERTa v3小規模版本,用於自然語言推理任務,準確率達87.46%
文本分類
Transformers 英語

D
mrm8488
139
3
Deberta Large Mnli
MIT
DeBERTa-V2-XXLarge是基於解耦注意力機制和增強型掩碼解碼器的改進型BERT模型,在多項自然語言理解任務上表現優異。
大型語言模型
Transformers 英語

D
microsoft
1.4M
18
V3large 1epoch
MIT
DeBERTa是基於解耦注意力機制的增強型BERT解碼模型,在自然語言理解任務上表現優異。
大型語言模型
Transformers 英語

V
NDugar
32
0
Debertav3 Mnli Snli Anli
DeBERTa是基於解耦注意力機制的增強型BERT解碼模型,通過改進BERT與RoBERTa模型,在多數自然語言理解任務中表現更優。
大型語言模型
Transformers 英語

D
NDugar
26
3
ZSD Microsoft V2xxlmnli
MIT
基於解耦注意力機制的增強型BERT解碼模型,在MNLI任務上微調的大規模版本
大型語言模型
Transformers 英語

Z
NDugar
59
3
1epochv3
MIT
DeBERTa是基於解耦注意力機制的增強型BERT模型,在多項自然語言理解任務上超越BERT和RoBERTa表現
大型語言模型
Transformers 英語

1
NDugar
28
0
V3large 2epoch
MIT
DeBERTa是基於解耦注意力機制的增強型BERT改進模型,通過160GB訓練數據和15億參數規模,在多項自然語言理解任務中超越BERT和RoBERTa表現。
大型語言模型
Transformers 英語

V
NDugar
31
0
Deberta Large Mnli Zero Cls
MIT
DeBERTa是基於解耦注意力機制的增強型BERT解碼模型,通過改進注意力機制和掩碼解碼器,在多項自然語言理解任務上超越BERT和RoBERTa。
大型語言模型
Transformers 英語

D
Narsil
51.27k
14
V2xl Again Mnli
MIT
DeBERTa是基於解耦注意力機制的增強型BERT解碼模型,通過改進注意力機制和掩碼解碼器,在多項自然語言理解任務中超越BERT和RoBERTa表現。
大型語言模型
Transformers 英語

V
NDugar
30
0
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98