M

Mrt5 Large

由stanfordnlp開發
MrT5是基於ByT5改進的高效字節級語言模型,通過動態令牌合併技術縮短輸入序列長度約50%
下載量 33
發布時間 : 3/23/2025

模型概述

MrT5是ByT5的高效改進版本,通過在編碼器中集成令牌刪除機制動態縮短輸入序列長度,為字節級模型提供更高效的解決方案

模型特點

動態令牌合併
通過可學習的刪除門控機制動態決定令牌保留或刪除,有效縮短序列長度
高效字節處理
直接處理UTF-8字節流,無需分詞器,支持多語言處理
軟刪除訓練
採用softmax1注意力機制和PI控制器實現穩定的刪除率控制

模型能力

多語言文本生成
序列到序列轉換
高效字節級處理

使用案例

學術研究
語言模型效率研究
用於研究動態令牌合併對模型效率的影響
序列長度平均縮短50%
自然語言處理
多語言文本生成
支持15種語言的文本生成任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase