pegasus-billsum開源賬單摘要生成模型 - 免費部署，在billsum數據集表現佳

Home

Pegasus Billsum

Developed by vuiseng9

基於PEGASUS-large微調的賬單摘要生成模型，在billsum數據集上表現優異

文本生成

Transformers

#法律文本摘要 #高精度Rouge #長文本處理

Downloads 42

Release Time : 3/2/2022

Model Overview

該模型是基於PEGASUS架構的文本摘要模型，專門針對法律賬單文本的摘要生成任務進行了優化

Model Features

高效摘要生成

針對法律賬單文本優化的摘要生成能力

基於PEGASUS架構

採用Google提出的預訓練摘要生成架構

高性能ROUGE指標

在billsum測試集上達到rougeL 44.8的高分

Model Capabilities

法律文本摘要生成

長文本壓縮

關鍵信息提取

Use Cases

法律文檔處理

賬單摘要生成

自動生成法律賬單的簡潔摘要

ROUGE-L 44.8的摘要質量

文檔自動化

長文檔關鍵信息提取

從冗長法律文檔中提取核心內容

🚀 Pegasus模型訓練與評估項目

本項目基於transformers v4.13開發了一個模型，在這個分支中有一些小的補丁。

🚀 快速開始

環境準備

本項目需要克隆特定的倉庫並切換到指定的分支，以下是具體的操作步驟：

git clone https://github.com/vuiseng9/transformers
cd transformers
git checkout pegasus-v4p13 && git reset --hard 41eeb07
# 安裝依賴，設置摘要生成相關依賴
# . . .

模型訓練

以下是訓練模型的腳本，你可以根據需求調整參數：

#!/usr/bin/env bash

export CUDA_VISIBLE_DEVICES=0,1,2,3

NEPOCH=10
RUNID=pegasus-billsum-${NEPOCH}eph-run1
OUTDIR=/data1/vchua/pegasus-hf4p13/pegasus/${RUNID}
mkdir -p $OUTDIR

nohup python run_summarization.py \
    --model_name_or_path google/pegasus-large \
    --dataset_name billsum \
    --do_train \
    --adafactor \
    --learning_rate 2e-4 \
    --label_smoothing_factor 0.1 \
    --num_train_epochs $NEPOCH \
    --per_device_train_batch_size 2 \
    --do_eval \
    --per_device_eval_batch_size 2 \
    --num_beams 8 \
    --max_source_length 1024 \
    --max_target_length 256 \
    --evaluation_strategy steps \
    --eval_steps 1000 \
    --save_strategy steps \
    --save_steps 2000 \
    --logging_steps 1 \
    --overwrite_output_dir \
    --run_name $RUNID \
    --output_dir $OUTDIR > $OUTDIR/run.log 2>&1 &

模型評估

以下是評估模型的腳本，同樣可以根據需要調整參數：

#!/usr/bin/env bash

export CUDA_VISIBLE_DEVICES=3

DT=$(date +%F_%H-%M)
RUNID=pegasus-billsum-${DT}
OUTDIR=/data1/vchua/pegasus-hf4p13/pegasus-test/${RUNID}
mkdir -p $OUTDIR

nohup python run_summarization.py \
    --model_name_or_path vuiseng9/pegasus-billsum \
    --dataset_name billsum \
    --max_source_length 1024 \
    --max_target_length 256 \
    --do_predict \
    --per_device_eval_batch_size 8 \
    --predict_with_generate \
    --num_beams 8 \
    --overwrite_output_dir \
    --run_name $RUNID \
    --output_dir $OUTDIR > $OUTDIR/run.log 2>&1 &

評估結果

儘管模型進行了10個epoch的微調，但本模型採用的是訓練過程中評估損失最低的檢查點（@12000步，6.6個epoch，210分鐘）。使用此檢查點進行測試/預測，結果如下：

***** predict metrics *****
  predict_gen_len            =   179.7363
  predict_loss               =     1.2452
  predict_rouge1             =    56.8657
  predict_rouge2             =    38.6531
  predict_rougeL             =    44.8399
  predict_rougeLsum          =    51.6266
  predict_runtime            = 1:19:28.20
  predict_samples            =       3269
  predict_samples_per_second =      0.686
  predict_steps_per_second   =      0.086