P

Pile T5 Large

由EleutherAI開發
Pile-T5 Large 是基於 T5x 庫在 The Pile 數據集上訓練的編碼器-解碼器模型,主要用於英語文本到文本生成任務。
下載量 112
發布時間 : 9/1/2023

模型概述

Pile-T5 Large 是一個基於 Transformer 的語言模型,通過掩碼語言建模目標訓練,適用於英語文本生成和特徵提取任務。

模型特點

大規模訓練數據
在 825GiB 的 The Pile 數據集上訓練,包含多樣化的英語文本來源。
編碼器-解碼器架構
採用 T5 風格的編碼器-解碼器結構,適合序列到序列任務。
長序列處理能力
支持 512 標記的序列長度,適合處理較長文本。

模型能力

文本生成
特徵提取
掩碼語言建模

使用案例

研究
語言模型研究
用於研究大規模語言模型的行為和特性。
下游任務特徵提取
作為基礎模型提取特徵用於其他 NLP 任務。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase