Plsum Base Ptt5
P
Plsum Base Ptt5
由seidel開發
PLSUM 是一個針對葡萄牙語的多文檔抽取式摘要模型,能夠從多個文檔中提取關鍵句子並生成類似維基百科的摘要。
下載量 22
發布時間 : 3/2/2022
模型概述
PLSUM 是一個基於 T5 架構的葡萄牙語多文檔摘要模型,主要用於從多個相關文檔中提取關鍵句子並生成簡潔、連貫的摘要。該模型特別適用於生成類似維基百科風格的摘要。
模型特點
多文檔摘要
能夠整合來自多個文檔的信息,生成全面且連貫的摘要
維基百科風格
生成的摘要具有類似維基百科條目的結構和風格
葡萄牙語優化
專門針對葡萄牙語文本進行優化和訓練
抽取式摘要
採用抽取式方法,從原文中選取最重要的句子組成摘要
模型能力
多文檔摘要生成
關鍵信息提取
葡萄牙語文本處理
使用案例
知識整理
維基百科條目生成
從多個來源收集信息並生成維基百科風格的條目
生成簡潔、信息豐富的摘要,類似維基百科條目
內容聚合
新聞摘要
從多篇相關新聞報道中提取關鍵信息生成摘要
提供全面的事件概述,涵蓋多個來源的信息
🚀 PLSUM的摘要生成階段
PLSUM是用於葡萄牙語的多文檔抽取式摘要(MDAS)模型的摘要生成階段。其目標是根據PLSUM前一階段(抽取階段)從網站提取的多個句子,生成類似維基百科的摘要(輸入和輸出均為葡萄牙語)。
🚀 快速開始
💻 使用示例
基礎用法
# query: summary title
query = 'torta de limão'
# sentences: list of relevant sentences extracted from multiple documents (i.e via TF-IDF or Textrank or anyother extractive summarization model)
sentences = [
'apostar na união do doce com o azedinho da torta de limão é quase certeza de acertar na sobremesa. E você pode escolher a forma mais tradicional com uma massa crocante de farinha de trigo, ou dar um toque de sofisticação servindo porções em taças individuais .',
'uma fruta no ponto e suculenta faz toda a diferença no preparo de qualquer receita . por isso , aqui vão algumas dicas para escolher o limão ideal para fazer a torta de limão perfeita . observe bem a casca. Uma casca lisa mostra que o limão está suculento . ela também precisa ser bem verde e brilhante ; preste atenção à maciez . aperte a fruta suavemente , se ele ceder ao toque é porque está macio e no ponto para ser consumido ; atenção para a firmeza . mesmo sendo macio , o limão precisa ser firme .',
'tudo indica que a torta de limão nasceu nos estados unidos , na cidade de Key West , no estado da Flórida , a fins do século xix. por isso , o nome original da receita em inglês – key lime pie – seria originário do nome da cidade e do limão usado naquela região , bem semelhante ao limão taiti consumido no brasil , mas com uma casca amarelada .',
'as tortas têm a massa como base que podem se estender pelas laterais da sobremesa e até por cima , parecida com uma crosta , mais crocante ou cremosa de acordo com os ingredientes utilizados . podem ser feitas com biscoitos doces com manteiga derretida , ou com uma mistura de farinha , sal , açúcar , manteiga derretida , gema e água . a massa da torta também pode ser feita com um bolo , e a partir daí se estrutura a torta . ',
'as tortas , geralmente precisam ficar no forno a 200 ° c , por cerca de 20 a 40 minutos . dependendo de cada tipo de forno , o tempo pode variar',
'para fazer uma massa de torta quase sempre é usada uma gordura como base , geralmente a manteiga . tem a gordura , a farinha , o trigo e às vezes , ovos na sua composição . durante o processo não pode incorporar calor e nem desenvolver o glúten em excesso , pois queremos como resultado uma massa que se dissolve na boca .'
]
input_text = 'summarize: {}'.format(query) + sentences.join('</s>')
# input_text = "summarize: torta de limão </s> apostar na união do doce com o azedinho da torta de limão é quase certeza de acertar na sobremesa. E você pode escolher a forma mais tradicional com uma massa crocante de farinha de trigo, ou dar um toque de sofisticação servindo porções em taças individuais. </s> uma fruta no ponto e suculenta faz toda a diferença no preparo de qualquer receita . por isso , aqui vão algumas dicas para escolher o limão ideal para fazer a torta de limão perfeita . observe bem a casca. Uma casca lisa mostra que o limão está suculento . ela também precisa ser bem verde e brilhante ; preste atenção à maciez . aperte a fruta suavemente , se ele ceder ao toque é porque está macio e no ponto para ser consumido ; atenção para a firmeza . mesmo sendo macio , o limão precisa ser firme . </s> tudo indica que a torta de limão nasceu nos estados unidos , na cidade de Key West , no estado da Flórida , a fins do século xix. por isso , o nome original da receita em inglês – key lime pie – seria originário do nome da cidade e do limão usado naquela região , bem semelhante ao limão taiti consumido no brasil , mas com uma casca amarelada . </s> as tortas têm a massa como base que podem se estender pelas laterais da sobremesa e até por cima , parecida com uma crosta , mais crocante ou cremosa de acordo com os ingredientes utilizados . podem ser feitas com biscoitos doces com manteiga derretida , ou com uma mistura de farinha , sal , açúcar , manteiga derretida , gema e água . a massa da torta também pode ser feita com um bolo , e a partir daí se estrutura a torta . </s> as tortas , geralmente precisam ficar no forno a 200 ° c , por cerca de 20 a 40 minutos . dependendo de cada tipo de forno , o tempo pode variar . </s> para fazer uma massa de torta quase sempre é usada uma gordura como base , geralmente a manteiga . tem a gordura , a farinha , o trigo e às vezes , ovos na sua composição . durante o processo não pode incorporar calor e nem desenvolver o glúten em excesso , pois queremos como resultado uma massa que se dissolve na boca ."
tokenizer = T5TokenizerFast.from_pretrained("seidel/plsum-base-ptt5")
model = T5ForConditionalGeneration.from_pretrained("seidel/plsum-base-ptt5", use_cache=False)
x = tokenizer([input_text], padding="max_length", max_length=512, return_tensors="pt", truncation=True)
y = model.generate(**x)
print(tokenizer.batch_decode(y, skip_special_tokens=True))
# output: a torta de limão é um doce feito com a fruta limão , que é uma mistura de farinha de trigo , sal , açúcar , manteiga derretida , gema e água . a massa da torta pode ser feita com biscoitos doces , biscoitinhos ou bolos . é uma receita tradicional dos estados unidos , com a utilização de uma massa crocante , ou ainda com um bolo .
Bart Large Cnn
MIT
基於英語語料預訓練的BART模型,專門針對CNN每日郵報數據集進行微調,適用於文本摘要任務
文本生成 英語
B
facebook
3.8M
1,364
Parrot Paraphraser On T5
Parrot是一個基於T5的釋義框架,專為加速訓練自然語言理解(NLU)模型而設計,通過生成高質量釋義實現數據增強。
文本生成
Transformers

P
prithivida
910.07k
152
Distilbart Cnn 12 6
Apache-2.0
DistilBART是BART模型的蒸餾版本,專門針對文本摘要任務進行了優化,在保持較高性能的同時顯著提升了推理速度。
文本生成 英語
D
sshleifer
783.96k
278
T5 Base Summarization Claim Extractor
基於T5架構的模型,專門用於從摘要文本中提取原子聲明,是摘要事實性評估流程的關鍵組件。
文本生成
Transformers 英語

T
Babelscape
666.36k
9
Unieval Sum
UniEval是一個統一的多維評估器,用於自然語言生成任務的自動評估,支持多個可解釋維度的評估。
文本生成
Transformers

U
MingZhong
318.08k
3
Pegasus Paraphrase
Apache-2.0
基於PEGASUS架構微調的文本複述模型,能夠生成語義相同但表達不同的句子。
文本生成
Transformers 英語

P
tuner007
209.03k
185
T5 Base Korean Summarization
這是一個基於T5架構的韓語文本摘要模型,專為韓語文本摘要任務設計,通過微調paust/pko-t5-base模型在多個韓語數據集上訓練而成。
文本生成
Transformers 韓語

T
eenzeenee
148.32k
25
Pegasus Xsum
PEGASUS是一種基於Transformer的預訓練模型,專門用於抽象文本摘要任務。
文本生成 英語
P
google
144.72k
198
Bart Large Cnn Samsum
MIT
基於BART-large架構的對話摘要模型,專為SAMSum語料庫微調,適用於生成對話摘要。
文本生成
Transformers 英語

B
philschmid
141.28k
258
Kobart Summarization
MIT
基於KoBART架構的韓語文本摘要模型,能夠生成韓語新聞文章的簡潔摘要。
文本生成
Transformers 韓語

K
gogamza
119.18k
12
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98