LEDBill開源模型 - 免費部署助力法律文本摘要高效生成

首頁

Ledbill

由d0r1h開發

基於Billsum數據集微調的長文檔編碼器-解碼器(LED)模型，專長於法律文本摘要生成

文本生成

Transformers

其他開源協議:Apache-2.0 #長文檔摘要 #法律文本處理 #16K上下文

下載量 22

發布時間 : 5/7/2022

模型概述

該模型是在billsum數據集上對led-base-16384進行微調的版本，擅長處理長文檔摘要任務，特別是法律條文類文本。基於Longformer架構，能處理長達16K的文本輸入。

模型特點

長文本處理能力

支持處理長達16K token的輸入文本，適合法律條文等長文檔

專業領域優化

在billsum法律文本數據集上微調，對法律條文摘要具有專業優勢

高效注意力機制

採用Longformer的局部+全局注意力模式，平衡計算效率與模型性能

模型能力

法律文本摘要

長文檔處理

文本壓縮

使用案例

法律領域

法律條文摘要

將複雜的法律條文壓縮為簡潔摘要

ROUGE-1得分38.65，在法律文本摘要任務中表現優異

法案分析

快速提取法案關鍵條款和修改內容

模型	rouge1-f	rouge1-p	rouge2-f	rouge2-p	rougeL-f	rougeL-p
LEDBill	34	37	15	16	30	32
led-base	2	15	0	0	2	15

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Ledbill

模型概述

模型特點

模型能力

使用案例

🚀 長序列編碼器 - 解碼器（LED）在Billsum數據集上微調模型

🚀 快速開始

💻 使用示例

基礎用法

📚 詳細文檔

📄 許可證