I

It5 Base Oscar

Developed by gsarti
首個針對意大利語進行大規模序列到序列Transformer模型預訓練的項目,基於OSCAR語料庫訓練
Downloads 19
Release Time : 3/2/2022

Model Overview

該模型是IT5模型家族的基礎版本,專門針對意大利語進行預訓練,採用T5架構,適用於各種序列到序列任務。

Model Features

意大利語專用預訓練
首個針對意大利語進行大規模預訓練的序列到序列Transformer模型
基於OSCAR語料庫
使用OSCAR語料庫的意大利語部分進行訓練
改進版分詞器
採用在mC4意大利語部分訓練的SentencePieceUnigramTokenizer
TPU優化訓練
在Google Cloud的TPU3v8-VM機器上完成訓練,由Google TPU研究雲贊助

Model Capabilities

意大利語文本理解
意大利語文本生成
序列到序列轉換

Use Cases

自然語言處理
自然語言推理
可用於自然語言推理任務,如前提-假設關係判斷
參見微調模型gsarti/it5-base-nli
文本摘要
可用於意大利語文本的自動摘要生成
機器翻譯
可用於意大利語相關的翻譯任務
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase