led_base_16384_billsum_summarization开源模型 - 高效进行长文档摘要生成

首页

Led Base 16384 Billsum Summarization

由 AlgorithmicResearchGroup 开发

该模型是在billsum数据集上对led-base-16384进行微调的版本，专门用于长文档摘要生成任务。

文本生成

Transformers

支持多种语言#长文本摘要 #法律文书处理 #16K上下文

下载量 15

发布时间 : 11/26/2022

模型简介

基于LED架构的文本摘要模型，针对法律条文等长文档进行优化，支持处理长达16K的文本输入。

模型特点

超长文本处理

支持处理长达16,384个token的长文档，通过复制位置嵌入矩阵实现。

法律文本优化

在billsum数据集上微调，特别适合法律条文等正式文档的摘要生成。

高效编码解码

采用LED架构，结合了Longformer的编码能力和BART的解码能力。

模型能力

长文档摘要生成

法律文本处理

结构化信息提取

使用案例

法律文档处理

法律条文摘要

自动生成冗长法律条文的简洁摘要

ROUGE-1得分47.672

法案内容提炼

从复杂法案中提取关键条款和修改内容

ROUGE-L得分34.568

政府文档处理

政策文件摘要

为政府政策文件生成执行摘要

模型	ROUGE - 1	ROUGE - 2	ROUGE - L	ROUGE - Lsum
LED Large	47.843	26.342	34.230	41.689
LED Base	47.672	26.737	34.568	41.529

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库

Led Base 16384 Billsum Summarization

模型简介

模型特点

模型能力

使用案例

🚀 Artifact - AI/led_base_16384_billsum_summarization模型

🚀 快速开始

在Transformers库中使用

✨ 主要特性

📚 详细文档

模型初始化

训练数据集

模型测试

模型效果

📄 许可证

📖 引用信息