roberta-base-100M-1開源模型 - 助力英語文本處理實用之選！

Roberta Base 100M 1

Developed by nyu-mll

基於1B詞元規模預訓練的RoBERTa基礎模型，驗證困惑度為3.93，適用於英語文本處理任務。

Downloads 63

Release Time : 3/2/2022

Model Overview

RoBERTa是一種基於Transformer架構的預訓練語言模型，通過優化BERT的訓練過程實現更好的性能。該模型在1B詞元規模的數據集上預訓練，適用於各種自然語言處理任務。

小規模數據預訓練

針對1B及以下詞元規模的數據集進行了優化預訓練，適合資源有限的應用場景

多批次大小驗證

提供512/1024/4096等多種批次大小的訓練版本，適應不同硬件條件

嚴格篩選

從多次運行中篩選驗證困惑度最低的模型發佈，確保質量

文本理解

文本生成

語義分析

語言建模

文本分類

情感分析

分析文本的情感傾向

問答系統

閱讀理解

基於給定文本回答問題

模型名稱	訓練數據規模	模型大小	最大步數	批量大小	驗證困惑度
roberta-base-1B-1	10億	BASE	100K	512	3.93
roberta-base-1B-2	10億	BASE	31K	1024	4.25
roberta-base-1B-3	10億	BASE	31K	4096	3.84
roberta-base-100M-1	1億	BASE	100K	512	4.99
roberta-base-100M-2	1億	BASE	31K	1024	4.61
roberta-base-100M-3	1億	BASE	31K	512	5.02
roberta-base-10M-1	1000萬	BASE	10K	1024	11.31
roberta-base-10M-2	1000萬	BASE	10K	512	10.78
roberta-base-10M-3	1000萬	BASE	31K	512	11.58
roberta-med-small-1M-1	100萬	MED - SMALL	100K	512	153.38
roberta-med-small-1M-2	100萬	MED - SMALL	10K	512	134.18
roberta-med-small-1M-3	100萬	MED - SMALL	31K	512	139.39