flan-t5-base-summarization-pt-br開源模型 - 優化微調實現葡萄牙語（巴西）文本摘要

首頁

Flan T5 Base Summarization Pt Br

由PamelaBorelli開發

基於FLAN-T5的葡萄牙語（巴西）文本摘要模型，經過指令微調優化

文本生成

Transformers

其他開源協議:MIT #葡萄牙語摘要 #指令微調 #T5架構

下載量 71

發布時間 : 6/14/2024

模型概述

該模型是基於FLAN-T5架構的文本摘要模型，專門針對葡萄牙語（巴西）進行優化，適用於生成高質量的文本摘要。

模型特點

多語言支持

基於FLAN-T5架構，支持多種語言，但專門針對葡萄牙語（巴西）進行優化。

指令微調

經過兩次微調，首先進行文本翻譯任務，隨後進行文本摘要任務，以提高模型在特定任務上的表現。

高效摘要生成

能夠快速生成高質量的文本摘要，適用於各種葡萄牙語文本。

模型能力

文本摘要

葡萄牙語文本處理

使用案例

新聞摘要

新聞文章摘要

自動生成新聞文章的簡短摘要，幫助用戶快速瞭解主要內容。

學術研究

論文摘要生成

為學術論文生成簡潔的摘要，便於研究人員快速瀏覽。

🚀 帕梅拉·博雷利/flan - t5 - base - 葡萄牙語摘要模型卡

本模型主要用於葡萄牙語的文本摘要任務，基於flan - t5 - base模型微調而來，在特定數據集上訓練，以提升葡萄牙語文本摘要的能力。

🚀 快速開始

使用示例

from transformers import T5Tokenizer, T5ForConditionalGeneration

tokenizer = T5Tokenizer.from_pretrained("PamelaBorelli/flan-t5-base-summarization-pt-br")
model = T5ForConditionalGeneration.from_pretrained("PamelaBorelli/flan-t5-base-summarization-pt-br")

input_text = "O corpo está mais propenso a sentir dores com exercícios de alta intensidade | Foto: Getty Images O problema está em saber identificar qual é qual. \"Em algumas situações, é difícil diferenciar uma da outra\", reconhece Juan Francisco Marco, professor do Centro de Ciência do Esporte, Treinamento e Fitness Alto Rendimento, na Espanha. \"A dor boa é aquela que associamos ao exercício físico, que não limita (o movimento) e permite continuar (a se exercitar) até o momento em que o músculo fica realmente esgotado e não trabalha mais\", explica. É importante detectar qual é o tipo de dor que você está sentindo, para evitar ter problemas mais sérios | Foto: Getty Images Para Francisco Sánchez Diego, diretor do centro de treinamento Corpore 10, \"a dor boa se sente no grupo muscular que você trabalhou, tanto durante o treinamento como nos dias seguintes\"."
input_ids = tokenizer(input_text, return_tensors="pt").input_ids

outputs = model.generate(input_ids)
print(tokenizer.decode(outputs[0]))

✨ 主要特性

基於多語言模型：原始模型 [flan - t5 - base](https://huggingface.co/google/flan - t5 - base#model - details) 是一個多語言模型，大小為2.48億參數，採用基於T5（Text - to - Text Transfer Transformer）的編碼器 - 解碼器架構。
微調優化：最終模型 [PamelaBorelli/flan - t5 - base - summarization - pt - br](PamelaBorelli/flan - t5 - base - summarization - pt - br) 經過了兩次微調，先進行文本翻譯微調，後進行葡萄牙語文本摘要任務微調。
特定語言適用：專為葡萄牙語文本摘要任務設計，未在其他語言上進行測試。

📚 詳細文檔

一般信息

屬性	詳情
名稱	[PamelaBorelli/flan - t5 - base - summarization - pt - br](PamelaBorelli/flan - t5 - base - summarization - pt - br)
類型	語言模型，Transformer編碼器 - 解碼器
許可證	MIT
基礎模型	[google/flan - t5 - base](https://huggingface.co/google/flan - t5 - base#model - details)
相關模型	FLAN - T5的檢查點
原始檢查點	FLAN - T5的檢查點

訓練數據

訓練參數

evaluation_strategy="steps"         # 評估輸出的方式
eval_steps=                         # 評估輸出的步數
learning_rate=                      # 學習率
per_device_train_batch_size=        # 訓練的批次大小
per_device_eval_batch_size=         # 驗證的批次大小
gradient_accumulation_steps=        # 累積批次的上限
weight_decay=                       # L2正則化
num_train_epochs=                   # 訓練的輪數
save_strategy="steps"               # 保存輸出的方式
save_steps =                        # 保存輸出的步數
push_to_hub=False                   # 是否將模型保存到Hugging Face的hub
load_best_model_at_end=True         # 在訓練結束時加載最佳模型（回調需要）

分詞參數

start_prompt= "Sumarize: \n"                 # 摘要指令的起始
end_prompt= "\n\nSumário: "    			 # 摘要指令的結束
input_name="coluna_imput"           		 # 數據集中源文本列的名稱
target_name="coluna_target"          		 # 數據集中目標文本列的名稱
max_input_length = 256         				 # 分詞的最大輸入長度
max_target_length = 256        				 # 分詞的最大目標長度
columns_to_remove= ['coluna_to_remove'] 	 # 從原始數據集中移除的列