🚀 IT5 Base for Wikipedia Summarization 📑 🇮🇹
このリポジトリには、WITSデータセット上でWikipediaの要約に関してファインチューニングされたIT5 Baseモデルのチェックポイントが含まれています。これは、Gabriele SartiとMalvina Nissimによる論文IT5: Large-scale Text-to-text Pretraining for Italian Language Understanding and Generationの実験の一部として行われました。
他の公開資料の包括的な概要は、gsarti/it5リポジトリで提供されています。報告されたスコアと評価アプローチに関する追加の詳細については、論文を参照してください。
🚀 クイックスタート
モデルの使用
モデルのチェックポイントは、Tensorflow、Pytorch、JAXで使用できます。パイプラインを使って直接使用することができます。
基本的な使用法
from transformers import pipelines
hg = pipeline("text2text-generation", model='it5/it5-base-wiki-summarization')
hg("Le dimensioni dell'isola sono di 8 km di lunghezza e di 3,2 km di larghezza. Si trova a 1,6 km a sud-est dell'isola di Renaud, dalla quale è separata dal passaggio Rodman. La sua altezza è di 100 m. Fu scoperta dall'esploratore e baleniere britannico John Biscoe nel 1832 e venne mappata durante una spedizione antartica francese realizzata nel primo decennio del XX secolo. Al comando della spedizione era Jean-Baptiste Charcot e il nome fu scelto per onorare l'esploratore e geografo francese Charles Rabot. === Rivendicazioni territoriali === * Secondo l'Argentina appartiene al dipartimento dell'Antartide Argentina nella provincia della Terra del Fuoco. * Secondo il Cile appartiene al comune antartico della provincia cilena antartica nella regione di Magallanes e dell'Antartico cileno. * Secondo il Regno Unito fa parte del territorio antartico britannico. Per il Trattato Antartico tali rivendicazioni sono sospese. Sull'isola è presente il rifugio Guillochon, sito storico antartico. "
- text: "Vanni ha la sua prima mostra personale nel 1948, alla Galleria Margherita di Roma. Nel 1949 vince una borsa di studio che lo porterà a studiare ad Amsterdam sotto la guida del pittore neoplastico Friedrich Vordemberge-Gildewart. Nel 1952 vince una Fulbright Scholarship che lo porterà a studiare in America, alla Yale University, sotto la guida di Josef Albers. Dal 1953 al 1960 si stabilisce a Parigi, dove illustra alcuni libri per bambini che in seguito vinceranno il premio del Club des Editeurs. Nel 1954 lavora come consulente del colore per il documentario su Picasso di Luciano Emmer, e nel 1955 comincia la sua lunga collaborazione con la Galleria Schneider, affiancando artisti come Corrado Cagli. Dal 1969 al 1974 lavora su dei bassorilievi in vetro resina sui quali vengono proiettati dei film astratti da lui creati, per creare dei quadri che si trasformino continuamente nel tempo. Nel 1979 lascia Roma per stabilirsi a New York, dove alla carriera di pittore affiancherà quella di professore per la prestigiosa Cooper Union School of Art, dove insegnerà ininterrottamente dal 1984 al 2014. L'opera pittorica di Vanni è segnata da una visione estremamente personale, lontana dalle correnti e dai movimenti che hanno caratterizzato la seconda metà del XX secolo. Memore delle lunghe conversazioni avute da Vanni nella sua primissima gioventù, con il filosofo e pittore futurista Alberto Bragaglia, le sue opere sono contrassegnate da un “eclettismo” formale programmatico, alla base del quale resta costante una conoscenza profonda delle molteplici tecniche artistiche utilizzate (tra cui il mosaico, l’affresco e la tempera ad uovo). Pur esprimendosi per lo più in cicli di opere dove l’astrazione formale è la principale componente figurativa, sono da sottolineare alcune opere dove Vanni ha dato prova di una importante padronanza dell’arte figurativa. Importanti e numerose sono le sue realizzazioni anche nel campo dell’illustrazione. Sue sono le illustrazioni per la novella ''Agostino'' di Alberto Moravia, per il libro ''Love'' di Lowell A. Siff e delle ''Contes de Cristal'' di Alice Coléno. Ha tenuto mostre personali in Italia e all’estero ed esposto in mostre collettive di rappresentanza italiana nei musei e nelle gallerie di ogni parte del mondo.")
>>> [{"generated_text": "L' '''isola di Rabot''' si trova in prossimità dell'isola di Renaud, a sud dell'Argentina."}]
高度な使用法
オートクラスを使ってロードすることもできます。
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
tokenizer = AutoTokenizer.from_pretrained("it5/it5-base-wiki-summarization")
model = AutoModelForSeq2SeqLM.from_pretrained("it5/it5-base-wiki-summarization")
引用
もしあなたがこのモデルを研究で使用する場合は、私たちの研究を次のように引用してください。
@article{sarti-nissim-2022-it5,
title={{IT5}: Large-scale Text-to-text Pretraining for Italian Language Understanding and Generation},
author={Sarti, Gabriele and Nissim, Malvina},
journal={ArXiv preprint 2203.03759},
url={https://arxiv.org/abs/2203.03759},
year={2022},
month={mar}
}
✨ 主な機能
- 言語:イタリア語
- ライセンス:Apache-2.0
- データセット:WITS
- タグ:イタリア語、シーケンス-to-シーケンス、Wikipedia、要約、WITS
- 評価指標:ROUGE、BERTScore
📚 ドキュメント
モデル情報
属性 |
详情 |
モデル名 |
it5-base-wiki-summarization |
タスク |
Wikipedia要約 |
データセット |
WITS |
評価指標 |
ROUGE1、ROUGE2、ROUGEL、BERTScore |
ROUGE1スコア |
0.369 |
ROUGE2スコア |
0.217 |
ROUGELスコア |
0.333 |
BERTScore |
0.530 |
BERTScoreパラメータ |
model_type: "dbmdz/bert-base-italian-xxl-uncased", lang: "it", num_layers: 10, rescale_with_baseline: True, baseline_path: "bertscore_baseline_ita.tsv" |
CO2排出量 |
17g(Google Cloud Platform Carbon Footprintより) |
トレーニングタイプ |
ファインチューニング |
地理的位置 |
オランダ、Eemshaven |
使用ハードウェア |
1 TPU v3 - 8 VM |
📄 ライセンス
このプロジェクトは、Apache-2.0ライセンスの下でライセンスされています。