mt5_summarize_japanese开源模型 - 免费部署实现日语新闻故事摘要生成

首页

Mt5 Summarize Japanese

由 tsmatz 开发

基于google/mt5-small微调的日语摘要生成模型，专门用于新闻故事摘要生成

文本生成

Transformers

日语开源协议:Apache-2.0 #日语新闻摘要 #MT5微调 #Rouge优化

下载量 552

发布时间 : 11/26/2022

模型简介

该模型是基于MT5架构的日语文本摘要生成模型，经过XL-Sum日语数据集微调，擅长从新闻文章中提取关键信息生成简洁摘要

模型特点

新闻摘要优化

专门针对新闻故事内容优化，能有效提取事件、背景、结果等关键信息

高效训练

基于预训练的MT5模型进行微调，训练效率高，仅需少量数据即可获得良好效果

多维度评估

使用Rouge系列指标全面评估摘要质量，确保生成内容的准确性和连贯性

模型能力

日语文本理解

新闻内容摘要生成

关键信息提取

使用案例

新闻媒体

新闻快报生成

自动从长篇新闻报道中生成简洁的新闻快报

Rouge1得分0.4625，表明能有效保留原文关键信息

新闻聚合摘要

为新闻聚合平台自动生成多篇相关报道的摘要

内容分析

舆情监测

自动分析大量新闻报道生成舆情摘要

🚀 mt5_summarize_japanese

这是一个针对日语摘要任务微调的模型，基于 google/mt5-small 微调而来，能够有效对日语新闻等文本进行摘要提取。

🚀 快速开始

本模型是 google/mt5-small 的微调版本，专为日语摘要任务训练。

该模型在 BBC 新闻文章（XL - Sum 日语数据集）上进行了微调，其中第一句（标题句）用作摘要，其余部分用作文章内容。

请在推理小部件中输入新闻故事（包括事件、背景、结果和评论等）作为源文本。（训练集中未包含其他语料，如对话、商业文档、学术论文或短篇小说等。）

该模型在评估集上取得了以下结果：

损失值：1.8952
Rouge1：0.4625
Rouge2：0.2866
Rougel：0.3656
Rougelsum：0.3868

💻 使用示例

基础用法

from transformers import pipeline

seq2seq = pipeline("summarization", model="tsmatz/mt5_summarize_japanese")
sample_text = "サッカーのワールドカップカタール大会、世界ランキング24位でグループEに属する日本は、23日の1次リーグ初戦において、世界11位で過去4回の優勝を誇るドイツと対戦しました。試合は前半、ドイツの一方的なペースではじまりましたが、後半、日本の森保監督は攻撃的な選手を積極的に動員して流れを変えました。結局、日本は前半に1点を奪われましたが、途中出場の堂安律選手と浅野拓磨選手が後半にゴールを決め、2対1で逆転勝ちしました。ゲームの流れをつかんだ森保采配が功を奏しました。"
result = seq2seq(sample_text)
print(result)

📚 详细文档

你可以从这里下载微调的源代码。

训练超参数

训练过程中使用了以下超参数：

属性	详情
学习率	0.0005
训练批次大小	2
评估批次大小	1
随机种子	42
梯度累积步数	16
总训练批次大小	32
优化器	Adam（β1 = 0.9，β2 = 0.999，ε = 1e - 08）
学习率调度器类型	线性
学习率调度器热身步数	90
训练轮数	10

训练结果

训练损失	轮数	步数	验证损失	Rouge1	Rouge2	Rougel	Rougelsum
4.2501	0.36	100	3.3685	0.3114	0.1654	0.2627	0.2694
3.6436	0.72	200	3.0095	0.3023	0.1634	0.2684	0.2764
3.3044	1.08	300	2.8025	0.3414	0.1789	0.2912	0.2984
3.2693	1.44	400	2.6284	0.3616	0.1935	0.2979	0.3132
3.2025	1.8	500	2.5271	0.3790	0.2042	0.3046	0.3192
2.9772	2.17	600	2.4203	0.4083	0.2374	0.3422	0.3542
2.9133	2.53	700	2.3863	0.3847	0.2096	0.3316	0.3406
2.9383	2.89	800	2.3573	0.4016	0.2297	0.3361	0.3500
2.7608	3.25	900	2.3223	0.3999	0.2249	0.3461	0.3566
2.7864	3.61	1000	2.2293	0.3932	0.2219	0.3297	0.3445
2.7846	3.97	1100	2.2097	0.4386	0.2617	0.3766	0.3826
2.7495	4.33	1200	2.1879	0.4100	0.2449	0.3481	0.3551
2.6092	4.69	1300	2.1515	0.4398	0.2714	0.3787	0.3842
2.5598	5.05	1400	2.1195	0.4366	0.2545	0.3621	0.3736
2.5283	5.41	1500	2.0637	0.4274	0.2551	0.3649	0.3753
2.5947	5.77	1600	2.0588	0.4454	0.2800	0.3828	0.3921
2.5354	6.14	1700	2.0357	0.4253	0.2582	0.3546	0.3687
2.5203	6.5	1800	2.0263	0.4444	0.2686	0.3648	0.3764
2.5303	6.86	1900	1.9926	0.4455	0.2771	0.3795	0.3948
2.4953	7.22	2000	1.9576	0.4523	0.2873	0.3869	0.4053
2.4271	7.58	2100	1.9384	0.4455	0.2811	0.3713	0.3862
2.4462	7.94	2200	1.9230	0.4530	0.2846	0.3754	0.3947
2.3303	8.3	2300	1.9311	0.4519	0.2814	0.3755	0.3887
2.3916	8.66	2400	1.9213	0.4598	0.2897	0.3688	0.3889
2.5995	9.03	2500	1.9060	0.4526	0.2820	0.3733	0.3946
2.3348	9.39	2600	1.9021	0.4595	0.2856	0.3762	0.3988
2.4035	9.74	2700	1.8952	0.4625	0.2866	0.3656	0.3868