T

T5 V1 1 Xxl

由google開發
T5 1.1是谷歌改進的文本到文本轉換Transformer模型,採用GEGLU激活函數和純無監督預訓練策略
下載量 597.64k
發布時間 : 3/2/2022

模型概述

基於Transformer的統一文本處理框架,通過遷移學習在多種NLP任務上實現優異性能

模型特點

GEGLU激活函數
在前饋隱藏層使用GEGLU替代ReLU,提升模型表現力
純無監督預訓練
僅在C4數據集上進行無監督預訓練,不混合下游任務數據
參數分離策略
嵌入層與分類器層不共享參數,提升模型靈活性
規模化架構調整
採用更大的d_model和更小的num_heads/d_ff比例優化大模型性能

模型能力

文本生成
文本分類
問答系統
摘要生成
機器翻譯
文本改寫

使用案例

文本摘要
新聞摘要生成
將長篇文章壓縮為關鍵信息摘要
在CNN/Daily Mail數據集達到SOTA
智能問答
開放域問答
回答基於文本內容的自然語言問題
在Natural Questions等基準測試表現優異
文本分類
情感分析
判斷文本情感傾向(正面/負面)
在GLUE基準測試中競爭力強
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase