中文ELECTRA開源預訓練模型 - 參數量小性能高，助力中文文本處理

首頁

Chinese Electra Base Generator

由hfl開發

中文ELECTRA是由哈工大-訊飛聯合實驗室（HFL）基於谷歌與斯坦福大學發佈的ELECTRA模型開發的中文預訓練模型，具有參數量小、性能高的特點。

大型語言模型

Transformers

中文開源協議:Apache-2.0 #輕量高效 #中文預訓練 #填充掩碼

下載量 15

發布時間 : 3/2/2022

模型概述

ELECTRA是一種高效的預訓練模型，通過替換BERT的掩碼語言模型任務為判別任務，顯著提升了訓練效率。中文ELECTRA系列模型在多項NLP任務中表現優異，且參數量僅為BERT的1/10。

模型特點

高效預訓練

採用ELECTRA的生成器-判別器架構，訓練效率顯著高於傳統BERT模型

小參數量高性能

ELECTRA-small僅需BERT及其變體1/10的參數量，即可達到相近甚至更高的性能

中文優化

專門針對中文語言特點進行優化，在中文NLP任務中表現優異

模型能力

文本理解

文本生成

語義分析

使用案例

自然語言處理

文本分類

可用於情感分析、主題分類等文本分類任務

問答系統

適用於構建中文問答系統

命名實體識別

可用於中文命名實體識別任務

🚀 中文ELECTRA

中文ELECTRA是基於ELECTRA官方代碼所發佈的預訓練模型。相較於BERT及其變體，它模型規模更小，性能卻頗具競爭力。ELECTRA-small在多個NLP任務中，僅用BERT及其變體十分之一的參數，就能達到相近甚至更高的分數。

🚀 快速開始

若你要重新訓練這些模型，請使用 ElectraForPreTraining 作為 discriminator，使用 ElectraForMaskedLM 作為 generator。

Google和斯坦福大學發佈了名為ELECTRA的新型預訓練模型。為進一步推動中文預訓練模型的研究，哈工大訊飛聯合實驗室（HFL）基於ELECTRA官方代碼發佈了中文ELECTRA模型。與BERT及其變體相比，ELECTRA模型規模更為緊湊，且在性能上頗具競爭力。ELECTRA-small在多個NLP任務中，僅用BERT及其變體十分之一的參數，就能達到相近甚至更高的分數。

本項目基於ELECTRA官方代碼：https://github.com/google-research/electra

你可能還對以下項目感興趣：

中文BERT系列：https://github.com/ymcui/Chinese-BERT-wwm
中文ELECTRA：https://github.com/ymcui/Chinese-ELECTRA
中文XLNet：https://github.com/ymcui/Chinese-XLNet
知識蒸餾工具包 - TextBrewer：https://github.com/airaria/TextBrewer

哈工大訊飛聯合實驗室（HFL）的更多資源：https://github.com/ymcui/HFL-Anthology

📄 許可證

本項目採用Apache-2.0許可證。

📚 詳細文檔

引用信息

如果您覺得我們的資源或論文有用，請在您的論文中包含以下引用：

https://arxiv.org/abs/2004.13922

@inproceedings{cui-etal-2020-revisiting,
    title = "Revisiting Pre-Trained Models for {C}hinese Natural Language Processing",
    author = "Cui, Yiming  and
      Che, Wanxiang  and
      Liu, Ting  and
      Qin, Bing  and
      Wang, Shijin  and
      Hu, Guoping",
    booktitle = "Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing: Findings",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/2020.findings-emnlp.58",
    pages = "657--668",
}