T

T5 Small Lm Adapt

由google開發
T5 1.1語言模型適配版是基於原始T5模型的改進版本,針對語言建模任務進行了優化,提升了在提示調優中的應用能力。
下載量 769
發布時間 : 3/2/2022

模型概述

該模型是T5 1.1的小規模版本,通過語言建模目標額外訓練了10萬步,顯著提升了在提示調優中的表現。

模型特點

GEGLU激活函數
在前饋隱藏層使用GEGLU激活函數替代ReLU,提升模型性能。
預訓練優化
預訓練階段關閉Dropout以提高質量,微調階段重新啟用Dropout。
參數調整
嵌入層與分類器層取消參數共享,調整模型結構參數。
雙重預訓練目標
同時針對去噪和語言建模目標進行預訓練。

模型能力

文本生成
文本分類
問答系統
摘要生成

使用案例

自然語言處理
提示調優
通過提示調優(prompt tuning)快速適應下游任務。
顯著提升在提示調優中的應用能力。
文本生成
生成連貫、上下文相關的文本。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase