D

Deberta V3 Xsmall

microsoftによって開発
DeBERTaV3はマイクロソフトが提案した改良版DeBERTaモデルで、ELECTRAスタイルの勾配分離埋め込み共有事前学習方法により効率を向上させ、自然言語理解タスクで優れた性能を発揮します。
ダウンロード数 87.40k
リリース時間 : 3/2/2022

モデル概要

DeBERTaV3は分離注意機構と強化型マスクデコーダを採用し、ELECTRAスタイルの事前学習方法と組み合わせることで、下流タスクにおけるモデルの性能を大幅に向上させました。

モデル特徴

勾配分離埋め込み共有
ELECTRAスタイルの事前学習方法を採用し、勾配分離技術により埋め込み共有メカニズムを最適化
分離注意機構
改良された注意機構により、内容と位置情報を別々に処理でき、モデルの理解能力を向上
効率的なパラメータ設計
xsmallバージョンはわずか2200万メインパラメータで、性能を維持しながらモデルサイズを大幅に削減

モデル能力

テキスト分類
質問応答システム
自然言語推論

使用事例

自然言語処理
質問応答システム
高性能な質問応答システムの構築に使用
SQuAD 2.0でF1スコア84.8、EMスコア82.0を達成
テキスト分類
自然言語推論タスクに使用
MNLIタスクで精度88.1/88.3(m/mm)を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase