解耦注意力機制

# 解耦注意力機制

Erlangshen DeBERTa V2 97M Chinese

擅長處理自然語言理解任務的中文DeBERTa-v2基礎模型，採用全詞掩碼技術，參數量9700萬。

大型語言模型

Transformers 中文

Deberta V2 Xxlarge Mnli

DeBERTa V2 XXLarge是基於解耦注意力機制的增強型BERT變體，在自然語言理解任務上超越RoBERTa和XLNet，參數量達15億

大型語言模型

Transformers 英語

DeBERTa 是一種基於解耦注意力機制的增強型 BERT 解碼模型，改進了 BERT 和 RoBERTa 模型，在自然語言理解任務中表現優異。

大型語言模型

Transformers 英語

Deberta V2 Xlarge

DeBERTa V2 XXLarge是微軟推出的增強型自然語言理解模型，通過解耦注意力機制和增強型掩碼解碼器改進BERT架構，在多項NLP任務上達到SOTA性能。

大型語言模型

Transformers 英語

Deberta V2 Xlarge Mnli

DeBERTa V2 XLarge是微軟推出的增強型自然語言理解模型，通過解耦注意力機制和增強型掩碼解碼器改進BERT架構，在多項NLU任務上超越BERT和RoBERTa的表現。

大型語言模型

Transformers 英語

Deberta Base Mnli

基於解耦注意力機制的增強型BERT解碼模型，在MNLI任務上微調

大型語言模型英語

Deberta V2 Xxlarge

DeBERTa V2 XXLarge是基於解耦注意力與增強掩碼解碼的改進型BERT模型，具有15億參數，在多項自然語言理解任務上超越BERT和RoBERTa表現

大型語言模型

Transformers 英語

Deberta V3 Small

DeBERTa-v3是微軟推出的改進版自然語言理解模型，通過ELECTRA風格預訓練和梯度解耦嵌入共享技術優化，在保持較小參數量的同時實現高效性能。

大型語言模型

Transformers 英語

Deberta Xlarge Mnli

DeBERTa-XLarge-MNLI是基於解耦注意力機制的增強型BERT模型，經過MNLI任務微調，擁有750M參數，在自然語言理解任務上表現優異。

大型語言模型

Transformers 英語

DeBERTa通過解耦注意力機制和增強型掩碼解碼器改進了BERT與RoBERTa模型，在多數自然語言理解任務上表現優異。

大型語言模型

Transformers 英語

Deberta V2 Xlarge

DeBERTa是基於解耦注意力機制的增強型BERT解碼模型，通過改進的注意力機制和增強型掩碼解碼器，在多項自然語言理解任務上超越BERT和RoBERTa的表現。

大型語言模型

Transformers 英語

DeBERTa是基於解耦注意力機制和增強型掩碼解碼器改進的BERT模型，在多項自然語言理解任務上表現優異。

大型語言模型英語

Deberta V3 Xsmall

DeBERTaV3是微軟提出的改進版DeBERTa模型，通過ELECTRA風格的梯度解耦嵌入共享預訓練方法提升效率，在自然語言理解任務中表現優異。

大型語言模型

Transformers 英語

DeBERTa是一種改進的BERT模型，通過解耦注意力機制和增強型掩碼解碼器提升性能，在多項自然語言理解任務上超越BERT和RoBERTa。

大型語言模型

Transformers 英語

Deberta V3 Large Mnli

基於MultiNLI數據集訓練的DeBERTa-v3-large模型，用於文本蘊含關係判斷

Transformers 英語

Deberta V3 Small Finetuned Mnli

在GLUE MNLI數據集上微調的DeBERTa v3小規模版本，用於自然語言推理任務，準確率達87.46%

Transformers 英語

Deberta Large Mnli

DeBERTa-V2-XXLarge是基於解耦注意力機制和增強型掩碼解碼器的改進型BERT模型，在多項自然語言理解任務上表現優異。

大型語言模型

Transformers 英語

DeBERTa是基於解耦注意力機制的增強型BERT解碼模型，在自然語言理解任務上表現優異。

大型語言模型

Transformers 英語

Debertav3 Mnli Snli Anli

DeBERTa是基於解耦注意力機制的增強型BERT解碼模型，通過改進BERT與RoBERTa模型，在多數自然語言理解任務中表現更優。

大型語言模型

Transformers 英語

ZSD Microsoft V2xxlmnli

基於解耦注意力機制的增強型BERT解碼模型，在MNLI任務上微調的大規模版本

大型語言模型

Transformers 英語

DeBERTa是基於解耦注意力機制的增強型BERT模型，在多項自然語言理解任務上超越BERT和RoBERTa表現

大型語言模型

Transformers 英語

DeBERTa是基於解耦注意力機制的增強型BERT改進模型，通過160GB訓練數據和15億參數規模，在多項自然語言理解任務中超越BERT和RoBERTa表現。

大型語言模型

Transformers 英語

Deberta Large Mnli Zero Cls

DeBERTa是基於解耦注意力機制的增強型BERT解碼模型，通過改進注意力機制和掩碼解碼器，在多項自然語言理解任務上超越BERT和RoBERTa。

大型語言模型

Transformers 英語

V2xl Again Mnli

DeBERTa是基於解耦注意力機制的增強型BERT解碼模型，通過改進注意力機制和掩碼解碼器，在多項自然語言理解任務中超越BERT和RoBERTa表現。

大型語言模型

Transformers 英語

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase