I

It5 Base Oscar

由gsarti開發
首個針對意大利語進行大規模序列到序列Transformer模型預訓練的項目,基於OSCAR語料庫訓練
下載量 19
發布時間 : 3/2/2022

模型概述

該模型是IT5模型家族的基礎版本,專門針對意大利語進行預訓練,採用T5架構,適用於各種序列到序列任務。

模型特點

意大利語專用預訓練
首個針對意大利語進行大規模預訓練的序列到序列Transformer模型
基於OSCAR語料庫
使用OSCAR語料庫的意大利語部分進行訓練
改進版分詞器
採用在mC4意大利語部分訓練的SentencePieceUnigramTokenizer
TPU優化訓練
在Google Cloud的TPU3v8-VM機器上完成訓練,由Google TPU研究雲贊助

模型能力

意大利語文本理解
意大利語文本生成
序列到序列轉換

使用案例

自然語言處理
自然語言推理
可用於自然語言推理任務,如前提-假設關係判斷
參見微調模型gsarti/it5-base-nli
文本摘要
可用於意大利語文本的自動摘要生成
機器翻譯
可用於意大利語相關的翻譯任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase