legal-summarizer开源法律文档摘要生成模型 - 把复杂法律术语变通俗表达

首页

Legal Summarizer

由 VincentMuriuki 开发

基于t5-base微调的法律文档摘要生成模型，能将复杂的法律术语转化为通俗易懂的表述

文本生成

Safetensors

英语开源协议:Apache-2.0 #法律术语简化 #长文本摘要 #T5微调

下载量 124

发布时间 : 9/22/2024

模型简介

专为宪法、财政法案等大型法律文档生成摘要而设计，帮助非专业人士理解核心内容

模型特点

法律术语转化

将复杂的法律术语转化为通俗易懂的表述

专业领域优化

针对法律文档特点进行专门优化

多长度摘要

支持生成50-150字不同长度的摘要

模型能力

法律文本理解

自动摘要生成

术语简化

使用案例

法律研究

快速理解法案要点

研究人员可快速获取长篇法律文书的要点

提高法律研究效率

公众服务

法律知识普及

帮助普通读者理解复杂的法律条款

促进法律知识传播

🚀 法律文档摘要生成器

本模型基于 t5-base 进行微调，用于对宪法和金融法案等大型法律文档进行摘要提取。它能够简化复杂的法律语言，让非专业人士也能轻松理解。

🚀 快速开始

本模型可以对法律文档进行摘要提取，简化复杂的法律语言，方便不同人群快速理解文档核心内容。

from transformers import T5Tokenizer, T5ForConditionalGeneration

tokenizer = T5Tokenizer.from_pretrained("VincentMuriuki/legal-summarizer")
model = T5ForConditionalGeneration.from_pretrained("VincentMuriuki/legal-summarizer")

text = "Your long legal document here..."
inputs = tokenizer("summarize: " + text, return_tensors="pt", max_length=1024, truncation=True)
summary_ids = model.generate(inputs["input_ids"], max_length=150, min_length=50, length_penalty=2.0, num_beams=4, early_stopping=True)

summary = tokenizer.decode(summary_ids[0], skip_special_tokens=True)
print(summary)

✨ 主要特性

精准摘要：能够对大型法律文档进行准确的摘要提取。
语言简化：将复杂的法律语言转化为通俗易懂的表述。

📦 安装指南

文档未提及安装步骤，跳过此章节。

💻 使用示例

基础用法

from transformers import T5Tokenizer, T5ForConditionalGeneration

tokenizer = T5Tokenizer.from_pretrained("VincentMuriuki/legal-summarizer")
model = T5ForConditionalGeneration.from_pretrained("VincentMuriuki/legal-summarizer")

text = "Your long legal document here..."
inputs = tokenizer("summarize: " + text, return_tensors="pt", max_length=1024, truncation=True)
summary_ids = model.generate(inputs["input_ids"], max_length=150, min_length=50, length_penalty=2.0, num_beams=4, early_stopping=True)

summary = tokenizer.decode(summary_ids[0], skip_special_tokens=True)
print(summary)