D

Deberta V3 Xsmall

Developed by microsoft
DeBERTaV3はマイクロソフトが提案した改良版DeBERTaモデルで、ELECTRAスタイルの勾配分離埋め込み共有事前学習方法により効率を向上させ、自然言語理解タスクで優れた性能を発揮します。
Downloads 87.40k
Release Time : 3/2/2022

Model Overview

DeBERTaV3は分離注意機構と強化型マスクデコーダを採用し、ELECTRAスタイルの事前学習方法と組み合わせることで、下流タスクにおけるモデルの性能を大幅に向上させました。

Model Features

勾配分離埋め込み共有
ELECTRAスタイルの事前学習方法を採用し、勾配分離技術により埋め込み共有メカニズムを最適化
分離注意機構
改良された注意機構により、内容と位置情報を別々に処理でき、モデルの理解能力を向上
効率的なパラメータ設計
xsmallバージョンはわずか2200万メインパラメータで、性能を維持しながらモデルサイズを大幅に削減

Model Capabilities

テキスト分類
質問応答システム
自然言語推論

Use Cases

自然言語処理
質問応答システム
高性能な質問応答システムの構築に使用
SQuAD 2.0でF1スコア84.8、EMスコア82.0を達成
テキスト分類
自然言語推論タスクに使用
MNLIタスクで精度88.1/88.3(m/mm)を達成
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase