๐ IT5 Base for Wikipedia Summarization ๐ ๐ฎ๐น
This repository holds the checkpoint for the IT5 Base model. It's fine - tuned for Wikipedia summarization on the WITS dataset. This is part of the experiments in the paper IT5: Large - scale Text - to - text Pretraining for Italian Language Understanding and Generation by Gabriele Sarti and Malvina Nissim.
A full overview of other released materials can be found in the gsarti/it5 repository. Check the paper for more details about the reported scores and the evaluation approach.
โจ Features
- Multilingual Support: Supports Italian language for Wikipedia summarization tasks.
- Multiple Metrics Evaluation: Evaluated using metrics like ROUGE and BERTScore.
- Carbon Footprint Information: Provides information about COโ equivalent emissions during training.
๐ฆ Installation
No installation steps were provided in the original README, so this section is skipped.
๐ป Usage Examples
Basic Usage
from transformers import pipelines
hg = pipeline("text2text-generation", model='it5/it5-base-wiki-summarization')
hg("Le dimensioni dell'isola sono di 8 km di lunghezza e di 3,2 km di larghezza. Si trova a 1,6 km a sud-est dell'isola di Renaud, dalla quale รจ separata dal passaggio Rodman. La sua altezza รจ di 100 m. Fu scoperta dall'esploratore e baleniere britannico John Biscoe nel 1832 e venne mappata durante una spedizione antartica francese realizzata nel primo decennio del XX secolo. Al comando della spedizione era Jean-Baptiste Charcot e il nome fu scelto per onorare l'esploratore e geografo francese Charles Rabot. === Rivendicazioni territoriali === * Secondo l'Argentina appartiene al dipartimento dell'Antartide Argentina nella provincia della Terra del Fuoco. * Secondo il Cile appartiene al comune antartico della provincia cilena antartica nella regione di Magallanes e dell'Antartico cileno. * Secondo il Regno Unito fa parte del territorio antartico britannico. Per il Trattato Antartico tali rivendicazioni sono sospese. Sull'isola รจ presente il rifugio Guillochon, sito storico antartico. ")
๐ Documentation
Model Information
- Model Name: it5-base-wiki-summarization
- Task: Wikipedia Summarization
- Dataset: WITS
Metrics
Property |
Details |
Model Type |
it5-base-wiki-summarization |
Training Data |
WITS |
Metrics |
ROUGE1 (0.369), ROUGE2 (0.217), ROUGEL (0.333), BERTScore (0.530) |
Carbon Footprint
- Emissions: 17g
- Source: Google Cloud Platform Carbon Footprint
- Training Type: Fine - tuning
- Geographical Location: Eemshaven, Netherlands, Europe
- Hardware Used: 1 TPU v3 - 8 VM
๐ License
The model is released under the Apache - 2.0 license.