D

Deberta V2 Xxlarge Mnli

microsoftによって開発
DeBERTa V2 XXLargeは分離注意メカニズムに基づく強化型BERT変種で、自然言語理解タスクにおいてRoBERTaとXLNetを凌駕、パラメータ数は15億に達します
ダウンロード数 4,077
リリース時間 : 3/2/2022

モデル概要

分離注意メカニズムと強化型マスクデコーダーで改良された事前学習言語モデルで、特にMNLIタスク向けにファインチューニングされており、様々な自然言語理解タスクに適用可能

モデル特徴

分離注意メカニズム
内容と位置の注意を分離計算することで、モデルの位置情報への感度を強化
強化型マスクデコーダー
改良されたマスク言語モデリング目標で、マスクされたトークンの絶対位置情報をより良く捕捉
大規模事前学習
80GBの訓練データを使用し、複数のNLUタスクでSOTA性能を達成

モデル能力

自然言語推論
テキスト分類
質問応答システム
意味的類似度計算

使用事例

テキスト理解
感情分析
テキストの感情傾向を分析
SST-2データセットで97.2%の精度を達成
質問応答システム
オープンドメインQAタスク
SQuAD 2.0でF1値92.2/EM 89.7
意味分析
テキスト含意認識
テキスト間の論理的関係を判断
RTEタスクで93.5%の精度
意味的類似度計算
文間の意味的類似度を計算
STS-Bピアソン相関係数93.2
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase