T

T5 Base Japanese

由sonoisa開發
基於日語語料庫預訓練的T5(文本到文本轉換Transformer)模型,適用於多種文本生成任務。
下載量 13.85k
發布時間 : 3/2/2022

模型概述

這是一個基於日語語料庫預訓練的T5模型,主要用於文本到文本生成任務。模型經過大規模日語語料庫訓練,支持多種下游任務的微調。

模型特點

高效性能
與多語言T5模型相比,體積縮小25%,準確率高出約6個百分點。
大規模預訓練
使用了約100GB的日語語料庫進行預訓練,包括維基百科、OSCAR和CC-100。
多任務支持
通過微調可支持多種文本生成任務,如分類、問答等。

模型能力

文本生成
文本分類
問答系統

使用案例

新聞分類
livedoor新聞分類
使用livedoor新聞語料庫進行新聞文章類型預測任務。
準確率達到97%,F1分數為0.97。
問答系統
JSQuAD問答任務
在JGLUE基準測試中的JSQuAD任務上表現優異。
EM=0.900, F1=0.945。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase