Electra Base Generator

E

Electra Base Generator

由google開發

ELECTRA是一種通過判別式預訓練的自監督語言表示學習方法，以較低計算成本實現高效訓練。

大型語言模型英語開源協議:Apache-2.0 #判別式預訓練 #低計算成本 #文本編碼器

下載量 4,429

發布時間 : 3/2/2022

模型概述

ELECTRA模型通過區分真實與生成的輸入標記進行預訓練，類似GAN的判別器。適用於小規模單GPU訓練和大規模高性能場景。

模型特點

判別式預訓練

採用類似GAN的判別器機制，而非傳統生成式預訓練

高效訓練

相比傳統方法顯著降低計算成本，單GPU即可獲得優異效果

多任務適配

支持分類、問答、序列標註等多種下游任務微調

模型能力

文本編碼

文本分類

問答系統

序列標註

使用案例

自然語言處理

GLUE基準測試

在通用語言理解評估基準上實現高效微調

SQuAD問答系統

在斯坦福問答數據集上達到最先進性能

SQuAD 2.0上state-of-the-art表現

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase