T

T5 Base Japanese Web

由megagonlabs開發
基於日語網絡文本預訓練的T5模型,支持字節回退,32K詞表規模
下載量 4,917
發布時間 : 3/2/2022

模型概述

這是一個針對日語文本優化的T5(文本到文本轉換Transformer)模型,專門用於處理日語網絡文本的多種NLP任務。

模型特點

大詞表支持
採用32K詞表規模,能更好地處理日語文本
字節回退功能
支持字節回退,增強對未知詞彙的處理能力
大規模預訓練
使用mC4日語部分和日語維基百科進行預訓練,覆蓋廣泛網絡文本
TPU優化訓練
在TPU v3-8上高效訓練,耗時約126小時完成100萬步訓練

模型能力

日語文本理解
日語文本生成
文本轉換任務
語言模型微調

使用案例

自然語言處理
日語文本摘要
對日語文章進行自動摘要
日語問答系統
構建基於日語的知識問答系統
日語文本分類
對日語文本進行多類別分類
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase