T

T5 V1 1 Large

由google開發
T5 1.1是谷歌改進的文本到文本轉換模型,採用GEGLU激活函數並優化架構,專注於無監督預訓練
下載量 111.29k
發布時間 : 3/2/2022

模型概述

基於Transformer的統一文本到文本轉換框架,通過遷移學習實現多種NLP任務,需在下游任務微調後使用

模型特點

GEGLU激活函數
前饋網絡使用GEGLU替代ReLU,提升模型表達能力
無監督預訓練
僅在C4數據集進行純無監督預訓練,避免任務數據汙染
參數共享優化
取消嵌入層與分類器層的參數共享,提升模型靈活性
架構調整
增大模型維度同時減少注意力頭數,平衡計算效率與表現力

模型能力

文本生成
文本分類
問答系統
摘要生成
機器翻譯(需微調)

使用案例

文本生成
內容創作輔助
生成文章草稿或續寫文本
需微調後評估效果
信息提取
問答系統
構建開放域問答機器人
在SQuAD等基準測試表現優異
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase