E

Electra Large Generator

由google開發
ELECTRA是一種高效的自監督語言表示學習方法,通過判別式預訓練替代傳統生成式預訓練,顯著提升計算效率。
下載量 473
發布時間 : 3/2/2022

模型概述

ELECTRA採用判別器架構預訓練Transformer模型,通過區分真實標記與生成器偽造的標記來學習語言表示,在GLUE、SQuAD等任務中表現優異。

模型特點

高效預訓練
相比傳統MLM預訓練方法,計算效率提升4倍以上
判別式學習
採用GAN式判別器架構,學習區分真實/偽造標記
多尺度適配
提供Base/Small/Large等多種參數規模選擇

模型能力

文本編碼
語言理解
掩碼預測
下游任務微調

使用案例

自然語言理解
GLUE基準測試
在通用語言理解評估基準上取得優異表現
超越BERT同參數規模模型
問答系統
應用於SQuAD問答數據集
在SQuAD 2.0達到當時SOTA
文本處理
序列標註
支持文本分塊等序列標註任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase