🚀 flan-t5-portuguese-small-summarization
該模型旨在滿足葡萄牙語在特定任務上的模型需求。它在摘要任務中表現出色。不過,由於模型為小版本,偶爾可能會因單詞重音問題出現一些錯誤。
🚀 快速開始
以下是使用該模型進行摘要生成的示例代碼:
!pip install transformers
from transformers import pipeline
summarization = pipeline("summarization", model="rhaymison/flan-t5-portuguese-small-summarization", tokenizer="rhaymison/flan-t5-portuguese-small-summarization")
prompt =f"""
sumarize: No que consiste o transtorno dismórfico corporal? São pessoas que se acham feias e querem mudar sua aparência de forma obsessiva, mesmo que não tenham nenhum problema. Num dos estudos que fiz, detectamos que de 50% a 54% dos pacientes que procuram cirurgia de face, nariz ou abdômen apresentam essa condição. A cirurgia pode beneficiar aqueles com um quadro leve ou intermediário do transtorno. No entanto, os que apresentam um transtorno mais grave não devem ser operados, e sim encaminhados para tratamento psicológico. A maior dificuldade é que aceitem ajuda. Muitos preferem buscar um médico que dê sinal verde para a intervenção.
"""
output = summarization(prompt)
✨ 主要特性
- 專為葡萄牙語摘要任務設計,能有效滿足相關需求。
- 在摘要任務中展現出良好的性能。
📦 安裝指南
!pip install transformers
💻 使用示例
基礎用法
from transformers import pipeline
summarization = pipeline("summarization", model="rhaymison/flan-t5-portuguese-small-summarization", tokenizer="rhaymison/flan-t5-portuguese-small-summarization")
prompt = "sumarize: 具體需要總結的文本內容"
output = summarization(prompt)
🔧 技術細節
訓練超參數
在訓練過程中使用了以下超參數:
- 學習率(learning_rate):5e-05
- 訓練批次大小(train_batch_size):8
- 評估批次大小(eval_batch_size):8
- 隨機種子(seed):42
- 梯度累積步數(gradient_accumulation_steps):2
- 總訓練批次大小(total_train_batch_size):16
- 優化器(optimizer):Adam,β1=0.9,β2=0.999,ε=1e-08
- 學習率調度器類型(lr_scheduler_type):線性
- 訓練輪數(num_epochs):5
訓練結果
訓練損失(Training Loss) |
輪數(Epoch) |
步數(Step) |
驗證損失(Validation Loss) |
Rouge1 |
Rouge2 |
Rougel |
Rougelsum |
生成長度(Gen Len) |
1.847 |
0.27 |
500 |
1.7443 |
15.4969 |
5.9408 |
13.5074 |
14.5518 |
19.0 |
1.8333 |
0.53 |
1000 |
1.7194 |
15.6496 |
5.8641 |
13.5584 |
14.669 |
19.0 |
1.8043 |
0.8 |
1500 |
1.7209 |
15.8523 |
6.0544 |
13.7563 |
14.8941 |
19.0 |
1.7903 |
1.07 |
2000 |
1.7156 |
15.8969 |
6.0071 |
13.7534 |
14.8513 |
19.0 |
1.7862 |
1.33 |
2500 |
1.7007 |
15.8441 |
5.958 |
13.66 |
14.7226 |
19.0 |
1.7687 |
1.6 |
3000 |
1.6949 |
15.9134 |
6.0486 |
13.9238 |
14.9171 |
19.0 |
1.7724 |
1.87 |
3500 |
1.6909 |
15.8827 |
5.8941 |
13.7195 |
14.8736 |
19.0 |
1.7653 |
2.13 |
4000 |
1.6811 |
16.0819 |
5.9791 |
13.8639 |
15.0031 |
19.0 |
1.7392 |
2.4 |
4500 |
1.6761 |
15.706 |
5.7384 |
13.5978 |
14.7374 |
19.0 |
1.7578 |
2.67 |
5000 |
1.6729 |
15.8926 |
5.9629 |
13.767 |
14.9088 |
19.0 |
1.7353 |
2.93 |
5500 |
1.6675 |
16.0266 |
5.9024 |
13.8471 |
14.9721 |
19.0 |
1.7425 |
3.2 |
6000 |
1.6626 |
16.0732 |
6.1141 |
13.9016 |
15.0673 |
19.0 |
1.73 |
3.47 |
6500 |
1.6631 |
16.1333 |
6.0951 |
13.9551 |
15.0686 |
19.0 |
1.7355 |
3.73 |
7000 |
1.6616 |
16.1704 |
6.1575 |
14.0481 |
15.079 |
19.0 |
1.7139 |
4.0 |
7500 |
1.6572 |
16.2592 |
6.25 |
14.0403 |
15.1851 |
19.0 |
1.7188 |
4.27 |
8000 |
1.6580 |
16.1572 |
6.0661 |
14.0029 |
15.0935 |
19.0 |
1.7045 |
4.53 |
8500 |
1.6560 |
16.1409 |
6.1478 |
13.9806 |
15.0795 |
19.0 |
1.7201 |
4.8 |
9000 |
1.6541 |
16.3352 |
6.2366 |
14.1335 |
15.2755 |
19.0 |
框架版本
- Transformers 4.38.2
- Pytorch 2.2.1+cu121
- Datasets 2.18.0
- Tokenizers 0.15.2
📄 許可證
本模型採用 Apache-2.0 許可證。
反饋與聯繫
歡迎提供任何想法、幫助或報告問題。
郵箱:rhaymisoncristian@gmail.com